Inicio ASP Google pone a disposión de todos los investigadores la estructura de más...

Google pone a disposión de todos los investigadores la estructura de más de 200 millones de proteínas

..G.M.
Casi todo el catálogo de proteínas conocidas por la ciencia se encuentra en una base de datos abierta y gratuita con la predicción mediante inteligencia artificial de la estructura tridimensional de más de 200 millones de estas moléculas. Cualquier científico del mundo puede descargarse toda esta información con la que iniciar estudios que ayuden a comprender enfermedades tropicales desatendidas, entender otras sin cura como el alzhéimer e iniciar investigaciones de fármacos que las inhiban o las enciendan.

Una base de datos gratuita y abierta muestra la predicción de la estructura tridimensional de casi todas las proteínas conocidas por la ciencia

Suena casi como un sueño para la biomedicina, para la ciencia en general, y se llama AlphaFold, un sistema creado por la empresa de inteligencia artificial DeepMind, fundada en 2010 en Reino Unido y adquirida posteriormente por Google, en colaboración con el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI). Conocer la estructura tridimensional de las proteínas ha sido un reto para la ciencia. Se requieren años para construir la imagen 3D de una de estas moléculas.

A partir del genoma de las proteínas conocidas por la comunidad científica y de las estructuras tridimensionales que ya se conocían, los algoritmos de inteligencia artificial de DeepMind y el EMBL-EBI han generado la imagen 3D de esos más de 200 millones de proteínas. Sus creadores esperan que la base de datos «continúe aumentando nuestra comprensión de la biología, ayudando a muchos más científicos en su trabajo mientras buscas enfrentar los desafíos globales», señalan en un comunicado.

Los algoritmos de inteligencia artificial han generado la imagen 3D de las proteínas conocidas

Hace un año ya lanzaron la base de datos AlphaFold con todo el proteoma humano completo y más de 350.000 predicciones estructurales de proteínas. Posteriormente han ido ampliándola, incluyendo 17 proteomas que suponen enferemdades tropicales olividadas que cada año acaban con la vida de millones de personas en el mundo. Sus creadores señalan que la base de datos ya ha mostrado impacto para abordar el Chagas y la leishmaniosis.

estructura-trimensional-proteinas-base-de-datos-alphafold

Según Demis Hassabis, fundador y director ejecutivo de DeepMind, esta base de datos «ya está teniendo un impacto significativo y directo en la salud humana». Hassabis cuenta en la web de su compañía cómo investigadoes de la Sociedad Europea de Genética Humana le han transmitido el valor de las estructuras tridimensionales. Sobre todo para aquellos científicos que buscan comprender las causas de enfermedades genéticas raras.

Demis Hassabis: «AlphaFold ya está teniendo un impacto significativo y directo en la salud humana»

«Además, AlphaFold está acelerando el descubrimiento de fármacos al proporcionar una mejor comprensión de las proteínas recientemente identificadas que podrían ser objetivos de fármacos y ayudar a los científicos a encontrar más rápidamente medicamentos potenciales que se unan a ellas», añade.

Las nuevas ampliaciones de la base de datos incluyen predicciones para estructuras de proteínas de especies de bacterias, animales, plantas y otros organismos. «Abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales, incluida la sostenibilidad, la inseguridad alimentaria y enfermedades», selaña el comunicado.

«Abre nuevas vías de investigación en las ciencias de la vida que tendrán un impacto en los desafíos globales. Incluidos la sostenibilidad, la inseguridad alimentaria y enfermedades»

Así, ya hablan de los numerosos artículos científicos que citan la base de datos en solo un año de vida. Investigaciones en las que AlphaFold ha tenido impacto en la obtención de información sobre la enfermedad de Parkinson, entre otras patologías. Pero también se utiliza en otras áreas de la ciencia. Según DeepMind y el EMBL-EBI  ya se han generado resultados en un mayor conocimiento sobre la salud de las abejas, sobre cómo se forma el hielo, acerca de la evolución humana o la capacidad para combatir la contaminación por el plástico.

«Nuestra esperanza es que esta base de datos ampliada ayude a muchos más científicos en su importante trabajo y abra vías completamente nuevas de descubrimiento científico», ha dicho Hassabis. Pese al conocimiento que aporta esta herramienta, también es cierto que se basa en predicciones hechas por sistemas de inteligencia artificial. Por tanto, puede que no estén exentas de fallos o errores. DeepMind y EMBL-EBI tienen previsto seguir actualizando la base de datos e ir mejorándola. Además, se trata de un sistema de código abierto totalmente descargable a través de Google Cloud Public Datasets. Por lo que los científicos de todo el mundo pueden también mejorar los datos disponibles.

Noticias complementarias