Meta, la compañía de Mark Zuckerberg, lanza un atlas del metagenoma de más de 600 millones de proteínas

..G.M.
Se llama ESM Metagenomic Atlas y es el último desarrollo basado en inteligencia artificial de Meta, la compañía de Mark Zuckerberg que hasta hace poco todos conocíamos como Facebook. Es la primera base de datos que predice la estructura del metagenoma de 617 millones de proteínas, incluidas cientos de millones que se están catalogando actualmente y otras posibles combinaciones de aminoácidos que ni están catalogadas. Este atlas va más allá que el AlphaFold, el sistema que lanzó Google y el Instituto Europeo de Bioinformática de EMBL el pasado mes de julio y que incluía la estructura tridimensional de más de 200 millones de proteínas.

El atlas del metagenoma del fundador de Facebook triplica e número de proteínas incluido con respecto al lanzado por Google en julio

Si bien las predicciones 3D de AlphaFold se basan en las proteínas ya catalogadas y, por tanto, su proyección puede ser más exacta, los creadores del nuevo atlas metagenómico aseguran que su sistema es hasta 60 veces más rápido “y mantiene la precisión, lo que hace que nuestro enfoque sea escalable a bases de datos mucho más grandes”. Incluye proteínas de todo tipo, no solo aquellas que componen la vida animal y vegetal. “Es la primera visión de la materia oscura del universo proteico”, afirma Meta. Su enfoque permitió predecir la secuencia de los 617 millones de proteínas en dos semanas.

meta-atlas-metagenoma-proteinas-1
Infografía: Meta

¿Cómo funciona?
El sistema ofrece un nuevo enfoque para “leer” el lenguaje de las proteínas y de esa forma, poder proyectar cómo se pliegan y predecir, entrenando a las computadoras, la estructura tridimensional precisa de las proteínas a partir de su secuencia. Para conseguirlo utilizaron un modelo de lenguaje que permitiera a las computadoras aprender los patrones evolutivos de los aminoácidos y sus relaciones.

Ofrece un nuevo enfoque para “leer” el lenguaje de las proteínas y de esa forma, proyectar cómo se pliegan y predecir su estructural tridimensional

En su página web, Meta explica que, al igual que el texto de una carta, las proteínas se pueden escribir como secuencias de caracteres. Cada uno de los caracteres se corresponde con elementos químicos que forman los aminoácidos, componentes básicos de las proteínas. Estos aminoácidos se pueden combinar de infinidad de formas diferentes y las proteínas se pliegan en forma tridimensional de muchas maneras. La forma en la que se pliega determina en gran medida la función biológica que va a tener esa proteína.

Las secuencias de proteínas contienen patrones estadísticos que transmiten información sobre la estructura plegada de la proteína. Lo que supone que se puede deducir la estructura de una proteína observando los patrones en las secuencias de proteínas. Meta ha desarrollado un modelado de proteínas a escala evolutiva que utiliza la inteligencia artificial para apreder a leer los patrones en las secuencias de proteínas.

meta-atlas-metagenoma-proteinas
Infografía: Meta

El atlas del metagenoma de las proteínas puede ayudar a los investigadores a identificar estructuras sin caracterizar hasta ahora y descubrir otras nuevas

Este enfoque lo que hace es completar los espacios en blanco en millones y millones de secuencias de proteínas. Y de ahí, surge la información que permite predecir las estructuras en tres dimensiones de 617 millones de proteínas. Cada modelo tridimensional incluye colores que indican la fiabilidad de la predicción.

Además de compartir los modelos 3D de las proteínas, han publicado el trabajo de investigación que les ha llevado a desarrollar el sistema y una API para que los científicos puedan recuperar estructuras de proteínas específicas. Estos datos incluyen 15.000 millones de parámetros, “es el modelo de proteínas más grande hasta la fecha”, afirman.

Meta cree que el sistema “puede ayudar a los investigadores a identificar estructuras que no se han caracterizado antes, buscar relaciones evolutivas distantes y descubrir nuevas proteínas que pueden ser útiles en medicina y otras aplicaciones“. Ahora, siguen trabajando para ver cómo se pueden usar modelos de lenguaje con el fin de diseñar nuevas proteínas que puedan ayudar a resolver desafíos en salud y medio ambiente.

Noticias complementarias

Opinión

Multimedia

Especiales

Atención primaria

Sanidad privada

iSanidadental

Anuario

Accede a iSanidad

Síguenos en