In las primeras horas de una mañana de octubre, David Bakerbiólogo de proteínas de la Universidad de Washington (UW), recibió la llamada telefónica más esperada en la carrera de un científico. Al otro lado del mundo, Demis Hassabis y Juan saltador de Google DeepMind, una empresa de inteligencia artificial (IA), recibió la misma noticia. Los tres científicos habían recibido el premio Premio Nobel de Química 2024 por su “trabajo computacional sobre el diseño y la estructura de proteínas”.
Mientras que AlphaFold y el posterior Revolución de la IA en biología Atrajo mucha atención, a lo largo de décadas se colocaron los ladrillos fundamentales para los avances logrados en la estructura y el diseño de las proteínas en la actualidad. Para aquellos que no entienden los detalles, aquí hay una línea de tiempo progresiva que condujo a este logro monumental.
Un desglose cronológico del progreso en la investigación del diseño y la estructura de proteínas a lo largo de las décadas.
julia davie
1972: Anfinsen presenta el problema del plegamiento de proteínas
En ciencia, a menudo es difícil determinar cuándo surgió un problema científico. Pero la mayoría de los científicos estarían de acuerdo en que la semilla del problema del plegamiento de proteínas se plantó en el campo de la biología de las proteínas cuando el bioquímico Christian Anfinsen Ganó el Premio Nobel de Química en 1972 “por su trabajo sobre la ribonucleasa, especialmente en lo que respecta a la conexión entre la secuencia de aminoácidos y la conformación biológicamente activa”.
Anfinsen, basándose en sus estudios de la enzima ribonucleasa, propuso que toda la información necesaria para determinar la estructura terciaria de una proteína está codificada en su secuencia de aminoácidos. “Es seguro que se producirán avances importantes en la comprensión de la organización celular y de las causas y el control de las anomalías en dicha organización cuando podamos predecir, de antemano, las consecuencias fenotípicas tridimensionales de un mensaje genético”, dijo Anfinsen. en su Conferencia Nobel.
Así siguió la carrera para resolver el problema del plegamiento de proteínas; durante las siguientes décadas, los biólogos intentaron predecir de manera confiable las conformaciones tridimensionales de las proteínas a partir de secuencias unidimensionales.
1994: Comienza la competencia CASP
“Pero pasar de la secuencia a la estructura ha resultado tremendamente difícil (la versión biológica de predecir el clima), al menos en parte porque incluso una proteína relativamente pequeña puede asumir una gran cantidad de conformaciones posibles”, explicó Baker en un artículo destacado para el que escribió El científico a principios de siglo.
David Baker fue pionero en la creación de proteínas de novo que son más adecuadas para resolver problemas modernos que las proteínas naturales.
Ian C. Haydon, Instituto de Diseño de Proteínas de la Universidad de Washington
Así, en 1994, biólogos computacionales de la Universidad de Maryland John Moult y Krzysztof Fidelis creó el concurso Evaluación Crítica de Predicción Estructural (CASP) para permitir a los científicos abordar este problema de manera colaborativa. Cada dos años, los biólogos de proteínas competían para predecir las estructuras de algunas proteínas seleccionadas por el comité. Ganaron los modelos computacionales que arrojaron la mayor coincidencia con los datos experimentales.
“Las proteínas están formadas por residuos de aminoácidos, que a su vez están formados por átomos, y se intenta modelar todas las interacciones entre los átomos y cómo hacen que la proteína se pliegue”, explicó Baker, que participó en el concurso desde el principio. explicó los modelos físicos que utilizaban en aquel entonces en una entrevista anterior.
1998: Surge el programa Rosetta
Pronto, Baker y su equipo desarrollaron un nuevo software informático, Rosetta, que calculaba las energías de diferentes configuraciones para predecir la estructura óptima con la energía más baja.
“Al eliminar estructuras poco probables que tienen, por ejemplo, residuos hidrofóbicos expuestos al solvente, el programa toma muestras de manera inteligente del panorama total de plegamiento de proteínas, probando quizás aproximadamente un millón de conformaciones posibles para la estructura de menor energía”, escribió Baker en su estudio. El científico artículo destacado.
El programa Rosetta cumplió un doble propósito; Si bien fue útil para predecir la estructura de las proteínas, Baker también lo aplicó para diseñar nuevas proteínas.
2003: Baker revela la primera proteína de novo
“No pasó mucho tiempo después de nuestros primeros éxitos en la predicción de estructuras que comenzamos a pensar, bueno, tal vez en lugar de predecir en qué estructura se plegaría una secuencia, podríamos usar estos métodos para crear una estructura completamente nueva y luego descubrir en qué consiste. La secuencia podría adaptarse a ello”, dijo Baker en una entrevista a principios de este año.
En 2003, Baker y su equipo generaron el primera proteína de novouna proteína de 93 aminoácidos llamada Top7.1 Según Baker, el hecho de que la estructura de rayos X de Top7 se alineara bien con sus predicciones demostró que “la metodología moderna de diseño de proteínas puede diseñar proteínas completamente nuevas con precisión a nivel atómico”.
2008: Los científicos gamifican el diseño y el plegamiento de proteínas
Baker literalmente convirtió a Rosetta en un nombre familiar cuando él y su equipo lanzaron Rosetta@casauna iniciativa que aprovechó las computadoras domésticas de los voluntarios para complementar sus necesidades de potencia informática. Cuando los voluntarios que ofrecieron sus computadoras en casa vieron el software en funcionamiento, algunos de ellos dijeron que deseaban poder sugerir qué debería hacer el programa a continuación.
Entonces, Baker se asoció con científicos informáticos de su universidad y el juego doblar se lanzó en 2008. Los usuarios podían jugar arrastrando diferentes partes de proteínas en la pantalla para minimizar la energía; menos energía significaba más puntos. Fue el equilibrio perfecto entre trabajo y juego; de hecho, en 2011, un grupo de usuarios de Foldit ayudó resolver la estructura de una proteína que los científicos habían luchado por decodificar durante décadas.2 Los científicos ciudadanos también utilizaron el juego para ayudar diseñar nuevas proteínas.3
2018: AlphaFold ingresa al campo de las proteínas
Demis Hassabis llevó al equipo de AlphaFold a una velocidad incomparable en precisión en la predicción de la estructura de proteínas.
mente profunda
Mientras tanto, Hassabis, experto en neurociencia cognitiva y cofundador de DeepMind, también estaba destacando en los juegos. En 2016, su equipo aplicó sus expertos en redes neuronales profundas para lanzar AlphaGoun poderoso programa que derrotó a un campeón humano del juego de mesa, Go.4 Poco después, Hassabis centró su atención en el problema del plegamiento de proteínas.
Las competencias CASP experimentaron un progreso incremental a lo largo de los años con científicos que probaron diferentes modelos computacionales, pero el verdadero avance se produjo en CASP13 en 2018, cuando Hassabis y su equipo presentaron su programa basado en IA. AlfaFold.5 En lugar de modelar la dinámica de la energía para calcular estructuras, el enfoque de aprendizaje automático significó que el equipo entrenó a AlphaFold utilizando secuencias y estructuras de proteínas existentes. Después de aprender las reglas de miles de ejemplos, AlphaFold pudo aplicar patrones similares para predecir estructuras a partir de secuencias.
2020: AlphaFold2 resuelve el problema del plegamiento de proteínas
John Jumper, un actor crucial en AlphaFold, ayudó a resolver el problema del plegamiento de proteínas.
mente profunda
En la próxima competencia CASP en 2020, Jumper y Hassabis salieron más fuertes con su AlphaFold2 mejorado. La nueva versión predijo las estructuras del la mayoría de las proteínas de prueba con una precisión comparable a los métodos experimentales.6 Tal fue la magnitud del éxito de AlphaFold2, que Moult y otros expertos declararon que el Problema de plegamiento de proteínas de hace 50 años se solucionó en gran medida.
2024: Baker, Jumper y Hassabis se llevan el Premio Nobel de Química
En los años siguientes, DeepMind creó el Base de datos de estructura de proteínas AlphaFoldque ahora incluye más de 200 millones de estructuras. El acceso a estas estructuras proteicas abrió la puerta a una comprensión más profunda de sus funciones y aplicaciones potenciales en diversas áreas.
“AlphaFold ya ha acelerado y permitido descubrimientos masivos, incluido el agrietamiento de la estructura del complejo de poros nucleares. Y con esta nueva incorporación de estructuras que iluminan casi todo el universo proteico, podemos esperar que cada día se resuelvan más misterios biológicos”, dijo Eric Topolexperto en cardiología y genómica del Instituto Traslacional de Investigación Scripps, en un Artículo del blog de DeepMind. Jumper y Hassabis ganaron el Premio Lasker en 2023 por su trabajo en AlphaFold.
En cuanto al diseño de proteínas, después de su éxito inicial con Top7, Baker y su equipo desarrollaron varios otras proteínas de novo a lo largo de los años. Uno reciente particularmente digno de mención, según Baker, es un vacuna contra el coronavirus (SKYCovione), desarrollado en conjunto con neil rey en la Universidad de Washington, que es el primer medicamento de novo aprobado para uso humano.7 Baker tiene varios proyectos más en trámite, que abarcan diversas áreas de aplicación: terapias dirigidas, enzimas que degradan el plástico y proteínas fijadoras de dióxido de carbono.
“Las proteínas en la naturaleza evolucionaron bajo las limitaciones de la selección natural. Así, resuelven todos los problemas que fueron relevantes para la selección natural durante la evolución. Pero ahora podemos producir proteínas específicamente para 21calle-Problemas del siglo. Eso es lo realmente emocionante de este campo”, dijo Baker.
- Koepnick B, et al..Diseño de proteínas de novo por científicos ciudadanos. Naturaleza. 2019;570(7761): 390-394.
- Plata D, et al..Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles.Naturaleza. 2016;529(7587):484-489.
- Senior AW, et al..Predicción mejorada de la estructura de proteínas utilizando potenciales del aprendizaje profundo. Naturaleza. 2020;577(7792):706-710.
- Saltador J, et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza. 2021;596(7873):583-589.
- Paredes AC, et al. Obtención de potentes respuestas de anticuerpos neutralizantes mediante vacunas de nanopartículas proteicas diseñadas para el SARS-CoV-2. Celúla. 2020;183(5):1367-1382.e17.