AI crea una nueva proteína brillante, simulando 500 millones de años de evolución: Sciencealert

Sintetizar nuevas proteínas – los bloques de construcción De la vida biológica: es un campo científico de inmenso potencial, y un modelo de IA recientemente desarrollado promete crear instrucciones para nuevas proteínas mucho más allá de las que se encuentran en la naturaleza.


Los científicos en los EE. UU. Han utilizado el Modelo 3 Evolutario 3 (ESM3) para sintetizar una nueva proteína llamada ESMGFP (proteína fluorescente verde), que solo comparte el 58 por ciento de su material con su pariente natural más cercano TAGRFP.


Ese es el equivalente de 500 millones de años de evolución procesados ​​por AI, estima el equipo de investigación, y abre el camino para crear proteínas hechas a medida que pueden diseñarse para usos específicos o desbloquear más funciones de las proteínas existentes.

ESM3 utiliza algoritmos de IA para construir nuevas proteínas a partir de sus datos de entrenamiento. (Escala evolutiva)

“Más de tres mil millones de años de evolución han producido una imagen de biología codificada en el espacio de proteínas naturales”. escribir Los investigadores, dirigidos por Thomas Hayes, fundador de EvolutionaryScale en Nueva York, en su artículo publicado.


“Aquí mostramos que los modelos de lenguaje entrenados a escala en datos evolutivos pueden generar proteínas funcionales que están lejos de las proteínas conocidas”.

ESM3 fue entrenado en impresionantes secuencias de proteínas de 3.15 mil millones (el orden de aminoácidos En una proteína), 236 millones de estructuras de proteínas (sus formas 3D) y 539 millones de anotaciones de proteínas (etiquetas descriptivas).


Al detectar patrones en esos vastos tocadores de datos, el modelo de IA puede comprender lo que funciona y lo que no es en la construcción y funcionamiento de proteínas, de la misma manera que ChatGPT puede componer un nuevo poema que rima después de leer millones de poemas escritos por humanos.


Lo que hace que ESMGFP sea más especial es que funciona: es fluorescente al igual que su relativo TAGRFP. Proteínas fluorescentes darle a algunos organismos oceánicos su brilloy su uso como marcadores tener gran importancia en medicina y biotecnología.


“Elegimos la funcionalidad de la fluorescencia porque es difícil de lograr, fácil de medir y uno de los mecanismos más bellos de la naturaleza”, el equipo escritura.

El modelo de IA crea una nueva proteína que simula 500 millones de años de evolución biológica
Una representación de ESMGFP, una nueva proteína fluorescente verde generada por ESM3 que está distante de otras proteínas fluorescentes que se encuentran en la naturaleza. (Escala evolutiva)

La IA elimina gran parte de la prueba y error en síntesis de proteínasmientras agregamos la capacidad de explorar lejos de las proteínas que conocemos actualmente.


“Las proteínas pueden verse como existentes dentro de un espacio organizado donde cada proteína es vecina por todos los demás que está a un evento mutacional de distancia”, escribir los investigadores. “La estructura de la evolución aparece como una red dentro de este espacio, conectando todas las proteínas por los caminos que la evolución puede tomar entre ellas”.


Para que ocurra la evolución, el equipo dice que cada proteína debe cambiar a la siguiente sin el sistema del cual es parte que pierde su funcionalidad general. Un modelo de lenguaje reconoce las proteínas en este espacio.


Las proteínas diseñadas por ESM3 aún deben validar, sintetizar y probar, lo que lleva tiempo, pero el equipo confía en hacer más progresos aquí. En un futuro no muy lejano podríamos producir proteínas para todo, desde medicamentos hasta biomateriales, solo con algunas indicaciones inteligentes.


“Los modelos de lenguaje de proteínas no funcionan explícitamente dentro de las restricciones físicas de la evolución, sino que pueden construir implícitamente un modelo de la multitud de rutas potenciales que la evolución podría haber seguido”, los investigadores explicar.

La investigación ha sido publicada en Ciencia.