La nueva IA para plegar proteínas amplía enormemente los esfuerzos de Alphafold

La nueva IA de plegamiento de proteínas predice las estructuras de mil millones de proteínas

El nuevo atlas de código abierto, generado por una herramienta de inteligencia artificial llamada ESMFold2, aumenta enormemente el universo proteico conocido

Un modelo 3D generado por computadora de la proteína 4 asociada a linfocitos T citotóxicos.

La herramienta de IA diseñó aglutinantes contra la proteína 4 asociada a linfocitos T citotóxicos (CTLA-4).

Biblioteca de fotografías científicas/Alamy

El universo proteico conocido acaba de hacerse mucho más grande. Una herramienta de inteligencia artificial recientemente lanzada ha generado un atlas de más de mil millones de estructuras proteicas predichas y miles de millones de secuencias de proteínas más.

La base de datos, conocida como ESM Atlas, fue presentada hoy por investigadores del Biohub de la Iniciativa Chan Zuckerberg, un instituto biomédico creado en San Francisco, California, por el fundador de Facebook, Mark Zuckerberg, y su esposa, la médica y educadora Priscilla Chan.

El atlas eclipsa la base de datos AlphaFold de estructuras proteicas predichas en más de 800 millones de entradas, y un Atlas ESM anterior en unos 300 millones.

Sobre el apoyo al periodismo científico

Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado suscribiéndose. Al comprar una suscripción, ayudas a garantizar el futuro de historias impactantes sobre los descubrimientos y las ideas que dan forma a nuestro mundo actual.

Las predicciones se realizaron utilizando ESMFold2, un modelo de IA que, según Biohub, supera el rendimiento de AlphaFold3, la última versión del sistema de Google DeepMind y otras IA de predicción de estructuras de proteínas. El atlas se describe en una preimpresión publicada hoy.

“Lo que hace este atlas es mostrar la totalidad de la biología de las proteínas y especialmente las partes que son más desconocidas”, dice el director científico de Biohub, Alex Rives, quien dirigió el esfuerzo. “Creemos que será un sustrato realmente poderoso para el descubrimiento de nueva biología”.

Otros científicos están impresionados con los resultados, especialmente porque ESMFold2 es completamente de código abierto. Pero el modelo Biohub ingresa a un campo cada vez más poblado, en el que los modelos de proteínas patentados y de código abierto que compiten están logrando avances a una velocidad vertiginosa.

Predicciones de anticuerpos

ESMFold2 se basa en un modelo de “lenguaje de proteínas” que el equipo de Rives dio a conocer en 2024, que se entrenó con miles de millones de proteínas de todo el árbol de la vida. Incluye secuencias “metagenómicas” del suelo, el océano y otros entornos, que están ausentes en la base de datos AlphaFold de estructuras proteicas predichas.

El equipo de Rives dice que ESMFold2 supera a los métodos existentes, incluido AlphaFold3, a la hora de determinar la estructura correcta de complejos de proteínas que interactúan, incluidas las moléculas de anticuerpos que se unen a sus objetivos moleculares de antígeno.

En la preimpresión, los investigadores describen cómo utilizaron ESMFold2 para diseñar nuevos anticuerpos y otras proteínas que pueden unirse fuertemente a proteínas implicadas en cánceres y afecciones inmunológicas. Cuando se crearon y probaron en el laboratorio, una alta proporción de los diseños funcionó según lo previsto.

El equipo de Rives utilizó la herramienta para crear un atlas que contenía 1.100 millones de estructuras proteicas predichas, así como información sobre las secuencias de 6.800 millones de proteínas. La mayoría de ellas provienen de secuencias metagenómicas que habían sido mal caracterizadas. Rives espera que el atlas, que será de libre acceso, ayude a los científicos a establecer conexiones entre las partes conocidas y desconocidas del universo proteico. Utilizando el atlas, los investigadores encontraron similitudes estructurales entre las proteínas de defensa microbiana CRISPR y una proteína de edición de genes identificada en un hongo del suelo en 2023 y encontrada en otras especies eucariotas.

Base de datos complementaria

El atlas recién publicado debería ser “un recurso extraordinario para la biología”, dice Gemma Atkinson, bióloga computacional de la Universidad de Lund en Suecia. “Es emocionante ver cómo los modelos de lenguaje de proteínas a gran escala pueden capturar reglas fundamentales de la biología de las proteínas”.

Christine Orengo, bióloga computacional del University College de Londres, dice que las predicciones, que primero deberán evaluarse, podrían ayudar a descubrir nuevos pliegues y funciones de proteínas, con implicaciones para el diseño de proteínas y la comprensión básica de la biología.

Martin Steinegger, biólogo computacional de la Universidad Nacional de Seúl, dice que su mayor pregunta es qué tan bien ESMFold2 puede predecir la estructura de proteínas que son muy diferentes de las ya conocidas. Su equipo descubrió que la primera edición de ESMFold no era especialmente buena para predecir estructuras proteicas inusuales, especialmente las que se encuentran en los datos del metagenoma.

El biólogo computacional Sergey Ovchinnikov del Instituto Tecnológico de Massachusetts en Cambridge ve el Atlas ESM como un complemento a la base de datos AlphaFold, ampliamente utilizada, de más de 200 millones de estructuras de proteínas, en lugar de un reemplazo.

Las predicciones de ESMFold2 sobre las proteínas que interactúan son impresionantes, añade Ovchinnikov, pero no tan sorprendentes. A principios de este año, Isomorphic Labs, una filial biofarmacéutica de Google DeepMind, dio a conocer un modelo patentado que logró avances sustanciales en la predicción de tales estructuras. Los modelos de código abierto con los que el equipo de Biohub no comparó ESMFold2 directamente también han logrado resultados impresionantes en la predicción de interacciones de proteínas, dice Ovchinnikov.

La naturaleza totalmente de código abierto de ESMFold2, sin restricciones de uso comercial, significa que podría encontrar un amplio uso, afirma Ovchinnikov. “Espero que mucha gente esté entusiasmada de probar ESMFold2”.

Este artículo se reproduce con autorización y se publicó por primera vez el 27 de mayo de 2026.

Es hora de defender la ciencia

Si te ha gustado este artículo, me gustaría pedirte tu apoyo. Científico americano ha servido como defensor de la ciencia y la industria durante 180 años, y ahora mismo puede ser el momento más crítico en esos dos siglos de historia.

he sido un Científico americano suscriptor desde que tenía 12 años y me ayudó a moldear mi forma de ver el mundo. Ciencia-Am Siempre me educa y me deleita, e inspira una sensación de asombro por nuestro vasto y hermoso universo. Espero que también lo haga por ti.

Si te suscribes a Científico americanousted ayuda a garantizar que nuestra cobertura se centre en investigaciones y descubrimientos significativos; que tenemos los recursos para informar sobre las decisiones que amenazan a los laboratorios en todo Estados Unidos; y que apoyemos a los científicos tanto en ciernes como en activo en un momento en el que con demasiada frecuencia el valor de la ciencia misma pasa desapercibido.

A cambio, obtiene noticias esenciales, podcasts cautivadores, infografías brillantes, boletines informativos imperdibles, vídeos imprescindibles, juegos desafiantes y los mejores escritos e informes del mundo científico. Incluso puedes regalarle a alguien una suscripción.

Nunca ha habido un momento más importante para que nos levantemos y demostremos por qué la ciencia es importante. Espero que nos apoyes en esa misión.