Investigación
En julio de 2022, publicamos predicciones de la estructura de proteínas AlphaFold para casi todas las proteínas catalogadas conocidas por la ciencia. Lea el último blog aquí.
Hoy, estoy increíblemente orgulloso y emocionado de anunciar que DeepMind está haciendo una contribución significativa a la comprensión de la biología por parte de la humanidad.
Cuando nosotros anunciado AlphaFold 2 En diciembre pasado, fue aclamado como una solución al problema del plegamiento de proteínas que data de hace 50 años. La semana pasada publicamos el papel cientifico y código fuente explicando cómo creamos este sistema altamente innovador, y hoy compartimos predicciones de alta calidad para la forma de cada proteína del cuerpo humano, así como para las proteínas de 20 organismos adicionales en los que los científicos confían para sus investigaciones.
A medida que los investigadores busquen curas para enfermedades y soluciones a otros grandes problemas que enfrenta la humanidad (incluida la resistencia a los antibióticos, la contaminación por microplásticos y el cambio climático), se beneficiarán de nuevos conocimientos sobre la estructura de las proteínas. Las proteínas son como pequeñas y exquisitas máquinas biológicas. De la misma manera que la estructura de una máquina nos dice lo que hace, la estructura de una proteína nos ayuda a comprender su función. Hoy estamos compartiendo un tesoro de información eso se duplica La comprensión de la humanidad sobre el proteoma humano.y revela las estructuras proteicas que se encuentran en otros 20 organismos biológicamente importantes, desde E. coli hasta la levadura y desde la mosca de la fruta hasta el ratón.
Este será uno de los conjuntos de datos más importantes desde el mapeo del Genoma Humano.
Ewan Birney, director general adjunto del EMBL y director del EMBL-EBI
Como herramienta poderosa que apoya los esfuerzos de los investigadores, creemos que esta es la contribución más significativa que la IA ha hecho al avance del conocimiento científico hasta la fecha, y es un gran ejemplo de los beneficios que la IA puede aportar a la humanidad. Estos conocimientos sustentarán muchos avances futuros interesantes en nuestra comprensión de la biología y la medicina. Gracias a cinco años incansables de trabajo y mucho ingenio del equipo de AlphaFold, y al trabajo en estrecha colaboración durante los últimos meses con nuestros socios en Instituto Europeo de Bioinformática del EMBL (EMBL-EBI)podemos compartir este enorme y valioso recurso con el mundo.
Las proteínas son máquinas biológicas exquisitas, sus estructuras tridimensionales son a menudo estéticamente agradables y funcionalmente críticas como componentes básicos de la vida.
Este último trabajo se basa en anuncios Hicimos el pasado mes de diciembre, en la conferencia CASP14, cuando DeepMind presentó una versión radicalmente nueva de nuestro sistema AlphaFold, que fue reconocida por los organizadores de la evaluación como una solución al gran desafío de 50 años de comprender la estructura 3D de las proteínas. Determinar las estructuras de las proteínas de forma experimental es una tarea laboriosa y que requiere mucho tiempo, pero AlphaFold demostró que la IA podía predecir con precisión la forma de una proteína, a escala y en minutos, hasta la precisión atómica. En CASPnos comprometimos a compartir nuestros métodos y brindar un amplio acceso a este conjunto de conocimientos.
Mejoras en la precisión media de las predicciones en la categoría de modelado gratuito para el mejor equipo en cada CASP, medida como GDT al mejor de 5.
Este mes, hemos finalizado la enorme cantidad de trabajo duro para cumplir ese compromiso. Publicamos dos artículos revisados por pares en Naturaleza (1,2) y código de código abierto AlphaFold. Hoy, en colaboración con EMBL-EBIestamos increíblemente orgullosos de lanzar el Base de datos de estructura de proteínas AlphaFoldque ofrece la imagen más completa y precisa del proteoma humano hasta la fecha, duplicando con creces el conocimiento acumulado por la humanidad sobre estructuras de proteínas humanas de alta precisión.
Además del proteoma humano (las aproximadamente 20.000 proteínas expresadas por el genoma humano), estamos brindando acceso abierto a los proteomas de Otros 20 organismos biológicamente importantes, con un total de más de 350.000 estructuras proteicas. La investigación sobre estos organismos ha sido objeto de innumerables trabajos de investigación y numerosos avances importantes, y ha dado como resultado una comprensión más profunda de la vida misma. En los próximos meses planeamos ampliar enormemente la cobertura. a casi todas las proteínas secuenciadas conocidas por la ciencia – más de 100 millones de estructuras que cubren la mayor parte del mundo Base de datos de referencia UniProt. Es un verdadero almanaque de proteínas del mundo. Y el sistema y la base de datos se actualizarán periódicamente a medida que sigamos invirtiendo en futuras mejoras de AlphaFold.
Lo más interesante es que, en manos de científicos de todo el mundo, este nuevo almanaque de proteínas permitirá y acelerará la investigación que mejorará nuestra comprensión de estos componentes básicos de la vida. A través de nuestras primeras colaboraciones, ya hemos visto señales prometedoras de investigadores que utilizan AlphaFold en su propio trabajo. Por ejemplo, el Iniciativa sobre medicamentos para enfermedades desatendidas (DNDi) ha avanzado en su investigación sobre curas que salvan vidas de enfermedades que afectan desproporcionadamente a las zonas más pobres del mundo, y a la Centro de innovación enzimática en la Universidad de Portsmouth (CEI) está utilizando AlphaFold para ayudar a diseñar enzimas más rápidas para reciclar algunos de nuestros plásticos de un solo uso más contaminantes. Para aquellos científicos que confían en la determinación experimental de la estructura de las proteínas, las predicciones de AlphaFold han ayudado a acelerar su investigación. Como otro ejemplo, un equipo en el Universidad de Colorado en Boulder está encontrando prometedor el uso de predicciones de AlphaFold para estudiar la resistencia a los antibióticos, mientras que un grupo del Universidad de California San Francisco los ha usado para aumentar su comprensión de la biología del SARS-CoV-2. Y esto es sólo el comienzo de lo que esperamos sea una revolución en la bioinformática estructural. Con AlphaFold en el mundo, hay un tesoro de datos que ahora espera ser transformado en avances futuros.
AlphaFold abre nuevos horizontes de investigación y es inspirador ver una poderosa IA de vanguardia que permite trabajar en enfermedades que se concentran casi exclusivamente en poblaciones empobrecidas.
Ben Perry, líder de innovación abierta de Discovery, Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi)
Para el equipo de AlphaFold en DeepMind, este trabajo representa la culminación de cinco años de enorme esfuerzo, incluido el tener que superar creativamente muchos contratiempos desafiantes, lo que resultó en una serie de nuevas innovaciones algorítmicas sofisticadas que fueron necesarias para finalmente resolver el problema. Se basa en los descubrimientos de generaciones de científicos, desde los primeros pioneros de la cristalografía y la obtención de imágenes de proteínas, hasta los miles de especialistas en predicción y biólogos estructurales que han pasado años experimentando con proteínas desde entonces. Nuestro sueño es que AlphaFold, al proporcionar esta comprensión fundamental, ayude a muchos más científicos en su trabajo y abra vías completamente nuevas de descubrimiento científico.
Lo que nos llevó meses y años hacer, AlphaFold pudo hacerlo en un fin de semana.
Profesor John McGeehan, profesor de biología estructural y director del Centro de Innovación Enzimática (CEI) de la Universidad de Portsmouth
En DeepMind, nuestra tesis siempre ha sido que la inteligencia artificial puede acelerar drásticamente los avances en muchos campos de la ciencia y, a su vez, hacer avanzar a la humanidad. Construimos AlfaFold y el Base de datos de estructura de proteínas AlphaFold apoyar y elevar los esfuerzos de los científicos de todo el mundo en el importante trabajo que realizan. Creemos que la IA tiene el potencial de revolucionar la forma en que se hace ciencia en el siglo XXI, y esperamos con impaciencia los descubrimientos que AlphaFold podría ayudar a la comunidad científica a realizar a continuación.
Para obtener más información, diríjase a Nature para leer nuestros artículos revisados por pares que describen nuestra método completoy el proteoma humano. Puedes leer más sobre ellos en nuestro blog técnico. Si quieres explorar nuestro sistema, aquí tienes el código fuente abierto para AlphaFold y Cuaderno de colaboración para ejecutar secuencias individuales. Para explorar nuestras estructuras, EMBL-EBI, el líder mundial en datos biológicos, las aloja en una base de datos con capacidad de búsqueda que sea abierto y gratuito para todos.
Nos encantaría escuchar sus comentarios y comprender cómo AlphaFold ha sido útil en su investigación. Comparte tus historias en alfafold@deepmind.com.