Un vistazo a la próxima generación de AlphaFold

Investigación

Publicado
Autores

Equipo de Google DeepMind AlphaFold y equipo de Isomorphic Labs

Progreso de la actualización: Nuestro último modelo AlphaFold muestra una precisión significativamente mejorada y amplía la cobertura más allá de las proteínas a otras moléculas biológicas, incluidos los ligandos.

Desde su lanzamiento en 2020, AlfaFold ha revolucionado la forma en que se entienden las proteínas y sus interacciones. Google Deep Mind y Laboratorios isomórficos han estado trabajando juntos para sentar las bases de un modelo de IA más potente que amplíe la cobertura más allá de las proteínas a toda la gama de moléculas biológicamente relevantes.

hoy estamos compartiendo una actualización sobre el progreso hacia la próxima generación de AlphaFold. Nuestro último modelo ahora puede generar predicciones para casi todas las moléculas del Banco de datos de proteínas (PDB), alcanzando frecuentemente precisión atómica.

Desbloquea nuevos conocimientos y mejora significativamente la precisión en múltiples clases de biomoléculas clave, incluidos ligandos (moléculas pequeñas), proteínas, ácidos nucleicos (ADN y ARN) y aquellos que contienen modificaciones postraduccionales (PTM). Estos diferentes tipos de estructuras y complejos son esenciales para comprender los mecanismos biológicos dentro de la célula y han sido difíciles de predecir con alta precisión.

Las capacidades y el rendimiento ampliados del modelo pueden ayudar a acelerar los avances biomédicos y hacer realidad la próxima era de la “biología digital”, brindando nuevos conocimientos sobre el funcionamiento de las vías de las enfermedades, la genómica, los materiales biorenovables, la inmunidad de las plantas, posibles objetivos terapéuticos, los mecanismos para el diseño de fármacos y nuevas plataformas para permitir la ingeniería de proteínas y la biología sintética.

Serie de estructuras predichas comparadas con la verdad fundamental (blanco) de nuestro último modelo AlphaFold.

Más allá del plegamiento de proteínas

AlfaFold Fue un avance fundamental para la predicción de proteínas de cadena sencilla. Multímetro AlphaFold luego se expandió a complejos con múltiples cadenas de proteínas, seguido de AlphaFold2.3, que mejoró el rendimiento y amplió la cobertura a complejos más grandes.

En 2022, las predicciones estructurales de AlphaFold para casi todas las proteínas catalogadas conocidas por la ciencia se pusieron a disposición gratuitamente a través de Base de datos de estructura de proteínas AlphaFolden asociación con el Instituto Europeo de Bioinformática del EMBL (EMBL-EBI).

Hasta la fecha, 1,4 millones de usuarios en más de 190 países han accedido a la base de datos AlphaFold, y científicos de todo el mundo han utilizado las predicciones de AlphaFold para ayudar a avanzar en la investigación sobre todo, desde la aceleración de nuevas vacunas contra la malaria y avanzando descubrimiento de fármacos contra el cáncer al desarrollo enzimas que comen plástico para hacer frente a la contaminación.

Aquí mostramos las notables capacidades de AlphaFold para predecir estructuras precisas más allá del plegamiento de proteínas, generando predicciones de estructuras altamente precisas a través de ligandos, proteínas, ácidos nucleicos y modificaciones postraduccionales.

Rendimiento entre complejos proteína-ligando (a), proteínas (b), ácidos nucleicos (c) y modificaciones covalentes (d).

Acelerar el descubrimiento de fármacos

Los análisis iniciales también muestran que nuestro modelo supera con creces a AlphaFold2.3 en algunos problemas de predicción de la estructura de proteínas que son relevantes para el descubrimiento de fármacos, como la unión de anticuerpos. Además, predecir con precisión las estructuras proteína-ligando es una herramienta increíblemente valiosa para el descubrimiento de fármacos, ya que puede ayudar a los científicos a identificar y diseñar nuevas moléculas que podrían convertirse en fármacos.

El estándar actual de la industria es utilizar “métodos de acoplamiento” para determinar las interacciones entre ligandos y proteínas. Estos métodos de acoplamiento requieren una estructura proteica de referencia rígida y una posición sugerida para que se una el ligando.

Nuestro último modelo establece un nuevo estándar para la predicción de la estructura proteína-ligando al superar los mejores métodos de acoplamiento informados, sin requerir una estructura proteica de referencia o la ubicación del bolsillo del ligando, lo que permite predicciones de proteínas completamente nuevas que no se han caracterizado estructuralmente antes.

También puede modelar conjuntamente las posiciones de todos los átomos, lo que le permite representar toda la flexibilidad inherente de las proteínas y los ácidos nucleicos cuando interactúan con otras moléculas, algo que no es posible utilizando métodos de acoplamiento.

Aquí, por ejemplo, hay tres casos terapéuticamente relevantes publicados recientemente en los que las estructuras predichas de nuestro último modelo (que se muestran en color) coinciden estrechamente con las estructuras determinadas experimentalmente (que se muestran en gris):

  1. PORCN: Molécula anticancerígena en etapa clínica unida a su objetivo, junto con otra proteína.
  2. KRAS: Complejo ternario con un ligando covalente (un pegamento molecular) de un importante objetivo del cáncer.
  3. PI5P4Kγ: Inhibidor alostérico selectivo de una lípido quinasa, con múltiples implicaciones en enfermedades, incluido el cáncer y trastornos inmunológicos.

Predicciones para PORCN (1), KRAS (2) y PI5P4Kγ (3).

Isomorphic Labs está aplicando este modelo AlphaFold de próxima generación al diseño de fármacos terapéuticos, lo que ayuda a caracterizar de forma rápida y precisa muchos tipos de estructuras macromoleculares importantes para el tratamiento de enfermedades.

Nueva comprensión de la biología.

Al desbloquear el modelado de estructuras de proteínas y ligandos junto con ácidos nucleicos y aquellos que contienen modificaciones postraduccionales, nuestro modelo proporciona una herramienta más rápida y precisa para examinar la biología fundamental.

Un ejemplo involucra la estructura de CasLambda unido a crRNA y ADNparte de familia CRISPR. CasLambda comparte la capacidad de edición del genoma del Sistema CRISPR-Cas9, comúnmente conocidas como ‘tijeras genéticas’, que los investigadores pueden utilizar para cambiar el ADN de animales, plantas y microorganismos. El tamaño más pequeño de CasLambda puede permitir un uso más eficiente en la edición del genoma.

Estructura prevista de CasLambda (Cas12l) unida a crRNA y ADN, parte del subsistema CRISPR.

La última versión de la capacidad de AlphaFold para modelar sistemas tan complejos nos muestra que la IA puede ayudarnos a comprender mejor este tipo de mecanismos y acelerar su uso para aplicaciones terapéuticas. Más ejemplos son disponible en nuestra actualización de progreso.

Avanzando en la exploración científica

El espectacular salto de rendimiento de nuestro modelo muestra el potencial de la IA para mejorar en gran medida la comprensión científica de las máquinas moleculares que componen el cuerpo humano y el mundo más amplio de la naturaleza.

AlphaFold ya ha catalizado importantes avances científicos en todo el mundo. Ahora, la próxima generación de AlphaFold tiene el potencial de ayudar a avanzar en la exploración científica a velocidad digital.

Nuestros equipos dedicados en Google DeepMind e Isomorphic Labs han logrado grandes avances en este trabajo crítico y esperamos compartir nuestro progreso continuo.