tHoy (21 de septiembre), la Fundación Lasker anunció los ganadores de los premios de este año. Juan saltadorbiólogo computacional en DeepMind, y Demis Hassabiscofundador y CEO de DeepMind, recibieron el premio Premio Albert Lasker de Investigación Médica Básica 2023 por “la invención de AlphaFold, el sistema de inteligencia artificial (IA) que resolvió el antiguo desafío de predecir las estructuras tridimensionales de las proteínas a partir de la secuencia unidimensional de sus aminoácidos”, Anunciado la Fundación Lasker.
Jumper y Hassabis lideraron el equipo AlphaFold que revolucionó el campo de la biología estructural al acelerar el proceso de predicción de la estructura de las proteínas con velocidad y precisión. Su enfoque fusionó diferentes orígenes y disciplinas, y los investigadores han adoptado la plataforma para responder diversas preguntas biológicas.
Pequeña molécula, gran problema
John Jumper, ganador del premio Lasker, desempeñó un papel crucial al llevar al equipo de AlphaFold a nuevas alturas en la predicción de la estructura de las proteínas.
Mente profunda
Entre 1957 y 1960premio Nobel John Kendrewbioquímico del Laboratorio de Biología Molecular del Consejo de Investigación Médica, resolvió el primer modelo estructural de una proteína globular, mioglobina.1 Después de estudiar los resultados, premio Nobel de 1972. Christian Anfinsen, bioquímico de los Institutos Nacionales de Salud, postuló que, en teoría, la secuencia de aminoácidos de una proteína debería determinar completamente su estructura. Sin embargo, la estructura de las proteínas era muy difícil de estudiar.
Los científicos han dependido en gran medida de la cristalografía de rayos X durante décadas para los estudios de identificación de proteínas, pero los investigadores podrían pasar años intentando cristalizar proteínas. Luego, la invención de la microscopía electrónica criogénica (crio-EM) arrojó algo de luz sobre las estructuras esquivas de las proteínas, pero las imágenes del microscopio a menudo tenían resoluciones bajas. Se necesitaron años para avanzar lentamente en la crio-EM, pero en 2019, los científicos utilizaron la crio-EM para determinar las estructuras de casi 4.000 proteínas en el Protein Data Bank (PDB) de 150.000 entradas.2 Esto es sólo una fracción de las decenas de millones de secuencias de proteínas estimadas.
Automatizando la ruta de las proteínas
Para ampliar las predicciones de la estructura de las proteínas, los investigadores recurrieron a la inteligencia artificial. En 1994, John Moult y Krzysztof Fidelisambos biólogos computacionales de la Universidad de Maryland, fundaron la Evaluación Crítica de Predicción Estructural (CASP) competición, una prueba bianual diseñada para grupos predecir las estructuras tridimensionales de varias proteínas que ya fueron verificadas experimentalmente pero no publicadas. Los equipos recibieron puntuaciones basadas en la precisión sobre 100 utilizando el Prueba de distancia global (GDT).3 Desde el evento inaugural del CASP en 1994, la puntuación promedio aumentó constantemente de 20 a más de 50. Según los organizadores, 90 es el umbral para alcanzar los valores experimentales.
Uno de los primeros enfoques fue desarrollado por David Baker, bioquímico y biólogo computacional de la Universidad de Washington. Usó segmentos cortos del PDB para predecir estructuras de proteínas. Usando este modelo, roseta, Baker y su equipo realizaron varias iteraciones que mejoraron constantemente el rendimiento del programa en las competiciones CASP de principios de la década de 2000. Sin embargo, el progreso histórico en el CASP se estancó.
Ahora, los efectos de AlphaFold pueden verse como una tecnología transformadora que puede ser tan grande como una nueva tecnología de microscopio. Ahora puedes ver cosas que antes no podías ver.
-Martin Steinegger, Universidad Nacional de Seúl
DeepMind, una empresa de inteligencia artificial cofundada por Hassabis en 2010, logró diseñar una IA que podía vencer a los jugadores humanos en el ajedrez y en el juego más desafiante del go (AlphaGo). Mientras Hassabis veía jugar a AlphaGo, le recordó el juego en línea de Baker. Doblarlo, que se lanzó en 2008, donde los jugadores exploraron y crearon modelos precisos de estructura de proteínas. Poco después del éxito de AlphaGo en 2016, DeepMind se propuso abordar el siguiente desafío: el plegamiento de proteínas.
En 2016, Hassabis creía que su equipo podría crear un sistema de predicción de proteínas con el aprendizaje automático como componente central del sistema. Este sería uno de los primeros de su tipo, debutando en el competencia en 2018 como AlphaFold1.4 El aprendizaje automático contrastaba los enfoques tradicionales de IA que se basaban en ideas preconcebidas. lógica ejecutando iteraciones de los datos para descubrir patrones.
El premio Lasker Demis Hassabis llevó al equipo de AlphaFold a una velocidad incomparable en precisión en la predicción de la estructura de proteínas.
El equipo de Hassabis y Jumper ganó el CASP de ese año, y AlphaFold1 dejó una gran impresión al crear estructuras de alta precisión para 24 de 43 dominios de modelado. AlphaFold1 superó ampliamente al siguiente mejor método, que logró 14 de 43 dominios. Sin embargo, el equipo de AlphaFold sabía que no había alcanzado su máximo potencial para servir a los biólogos; había más trabajo por hacer.
Poco después, Jumper tomó la iniciativa en el rediseño del algoritmo AlphaFold con un equipo interdisciplinario de biólogos, químicos y biofísicos. Hassabis, Jumper y el equipo de AlphaFold idearon formas de ajustar el algoritmo para garantizar que AlphaFold2 aprendiera de manera eficiente.
incorporando una base de datos más grande para la capacitación ayudó enormemente a aumentar la precisión de las capacidades de predicción del software. “Mi contribución se hizo principalmente para entregarles estas bases de datos de proteínas metagenómicas más grandes y completas que puedan usar para la parte de entrenamiento o también para la parte de inferencia al final”, dijo Martín Steineggerbiólogo computacional de la Universidad Nacional de Seúl que ayudó a desarrollar AlphaFold2.
En el proximo CASP En la competencia de 2020, AlphaFold2 sorprendió a los asistentes con una precisión asombrosa y logró una puntuación media de 92,4 GDT en general en todos los objetivos.5 Este tipo de precisión rivalizaba con las técnicas experimentales y contaba con un error promedio comparable al ancho de un átomo. Esta iteración de AlphaFold tuvo éxito en parte debido a la complicada arquitectura construida por investigadores de diferentes orígenes y disciplinas.
Ver también “DeepMind AI acelera el tiempo para determinar las estructuras de las proteínas“
Tobin Sosnickbioquímico, biofísico y asesor doctoral de Jumper en la Universidad de Chicago, dijo: “Él tomó los principios de plegado en los que trabajó aquí [for his doctoral work] y los apliqué con éxito en combinación con la IA en DeepMind”.
Luego, en 2021, DeepMind publicó públicamente el código fuente de AlphaFold y su impresionante base de datos de más de 350.000 proteínas en colaboración con el Instituto Europeo de Bioinformática en el Laboratorio Europeo de Biología Molecular.6 Desde entonces, esta base de datos ha crecido hasta alcanzar más de 200 millones de estructuras.
“Fue AlphaFold quien llevó la precisión a un límite crítico donde la gente ahora decía que el problema de secuencia a estructura se había resuelto en gran medida.”, dijo Sosnick. La accesibilidad de esta poderosa herramienta inspiró su adopción generalizada y permitió a los investigadores llenar los vacíos de su propia investigación experimental.
Es un honor recibir este premio en reconocimiento al trabajo de nuestro equipo. El trabajo en AlphaFold ha sido una experiencia increíble y apenas estamos comenzando a ver cómo la IA nos ayudará a transformar la biología.
-John Jumper, Mente Profunda
“Normalmente, el trabajo computacional se consideraba un complemento del trabajo experimental”, dijo Steinegger. “Ahora, los efectos de AlphaFold pueden verse como una tecnología transformadora que puede ser tan grande como una nueva tecnología de microscopio. Ahora puedes ver cosas que antes no podías ver”.
“Es un honor recibir este premio en reconocimiento al trabajo de nuestro equipo. El trabajo en AlphaFold ha sido una experiencia increíble y apenas estamos comenzando a ver cómo la IA nos ayudará a transformar la biología”, dijo Jumper.
Ver también “Se anuncian los ganadores del premio Lasker 2022“
Referencias
- Kendrew JC, et al. Un modelo tridimensional de la molécula de mioglobina obtenido mediante análisis de rayos X.. Naturaleza. 1958;181:662–666.
- Benjin X, Ling L. Desarrollos, aplicaciones y perspectivas de la microscopía crioelectrónica.. PAGciencia de la proteína. 2020;29:872–882.
- Zemla A. LGA: un método para encontrar similitudes 3D en estructuras de proteínas. Res de ácidos nucleicos. 2003;31(13):3370-3374.
- Kryshtafovych A, et al. Evaluación crítica de métodos de predicción de la estructura de proteínas (CASP) -Ronda XIII. Proteínas. 2019;87(12):1011-1020.
- Moult J, et al. Evaluación crítica de técnicas de predicción de la estructura de proteínas, decimocuarta ronda. Libro de resúmenes CASP 14. 2020.
- Senior AW, et al.. Predicción mejorada de la estructura de proteínas utilizando potenciales del aprendizaje profundo. Naturaleza. 2020;577:706–710.