DeepMind AI puede predecir si las mutaciones del ADN pueden ser dañinas

La IA AlphaMissense de Google DeepMind puede predecir si las mutaciones afectarán el funcionamiento de proteínas como la subunidad beta de la hemoglobina (izquierda) o el regulador de conductancia transmembrana de la fibrosis quística (derecha).

Google DeepMind

La empresa de inteligencia artificial Google DeepMind se ha adaptado su sistema AlphaFold para predecir la estructura de las proteínas para evaluar si una gran cantidad de mutaciones simples son dañinas.

El sistema adaptado, llamado AlphaMissense, ha hecho esto para 71 millones de posibles mutaciones de un tipo llamado mutaciones sin sentido en las 20.000 proteínas humanas, y los resultados puestos a disposición gratuitamente.

“Creemos que esto es muy útil para los médicos y genetistas humanos”, dice jun cheng en Google DeepMind. “Con suerte, esto puede ayudarles a identificar la causa de la enfermedad genética”.

Casi todas las personas nacen con entre 50 y 100 mutaciones que no se encuentran en sus padres, lo que resulta en una gran cantidad de variación genética entre individuos. Para doctores secuenciar el genoma de una persona en un intento de encontrar la causa de una enfermedadesto plantea un enorme desafío, porque puede haber miles de mutaciones que podría estar relacionado con esa condición.

AlphaMissense se ha desarrollado para intentar predecir si estas variantes genéticas son inofensivas o podrían producir una proteína relacionada con una enfermedad.

Un gen que codifica proteínas le dice a una célula qué aminoácidos deben unirse para formar una proteína, y cada conjunto de tres letras de ADN codifica un aminoácido. El La IA se centra en mutaciones sin sentido, que ocurre cuando una de las letras del ADN en un triplete cambia a otra letra y puede provocar que se agregue un aminoácido incorrecto a una proteína. Dependiendo de en qué parte de la proteína suceda esto, puede resultar en cualquier cosa, desde ningún efecto hasta que una proteína crucial ya no funcione en absoluto.

Las personas tienden a tener alrededor de 9000 mutaciones sin sentido cada una. Pero hasta ahora se han identificado los efectos de sólo el 0,1 por ciento de los 71 millones de posibles mutaciones sin sentido que podríamos tener.

AlphaMissense no intenta descubrir cómo una mutación sin sentido altera la estructura o estabilidad de una proteína, y qué efecto tiene esto en sus interacciones con otras proteínas, aunque comprender esto podría ayudar a encontrar tratamientos. En cambio, compara la secuencia de cada posible proteína mutada con las de todas las proteínas en las que se entrenó AlphaFold para ver si queda “natural”, dice Žiga Avsec en Google DeepMind. Las proteínas que parecen “antinaturales” se clasifican como potencialmente dañinas en una escala de 0 a 1.

Pushmeet Kohli En Google DeepMind utiliza el término “intuición” para describir cómo funciona. “En cierto sentido, este modelo aprovecha la intuición que adquirió al resolver la tarea de predicción de estructuras”, dice.

“Es como si sustituyéramos una palabra de una oración en inglés, una persona familiarizada con el inglés podría ver inmediatamente si esta sustitución de palabras cambiará el significado de la oración”, dice Avsec.

El equipo dice que AlphaMissense superó a otros métodos computacionales cuando se probó en variantes conocidas.

En un artículo que comenta la investigación, José Marsh en la Universidad de Edimburgo, Reino Unido, y Sara Teichmann en la Universidad de Cambridge escriben que AlphaMissense produjo “resultados notables” en varias pruebas diferentes de su desempeño y será útil para priorizar qué posibles mutaciones causantes de enfermedades deben investigarse más a fondo.

Sin embargo, estos sistemas sólo pueden ayudar en el proceso de diagnóstico, escriben.

Las mutaciones sin sentido son simplemente uno de los muchos tipos diferentes de mutaciones. También se pueden agregar, eliminar, duplicar, invertir, etc., fragmentos de ADN. Y muchas mutaciones que causan enfermedades no alteran las proteínas, sino que ocurren en secuencias cercanas involucradas en la regulación de la actividad de los genes.

Temas: