Construyendo modelos de IA que comprendan los principios químicos | Noticias del MIT

Entre todos los posibles compuestos químicos, se estima que entre 1020 y 1060 pueden tener potencial como fármacos de molécula pequeña.

Evaluar experimentalmente cada uno de esos compuestos consumiría demasiado tiempo para los químicos. Por eso, en los últimos años, los investigadores han comenzado a utilizar la inteligencia artificial para ayudar a identificar compuestos que podrían ser buenos candidatos a fármacos.

Uno de esos investigadores es el profesor asociado del MIT Connor Coley PhD ’19, profesor asociado de desarrollo profesional de la promoción de 1957 con nombramientos compartidos en los departamentos de Ingeniería Química e Ingeniería Eléctrica e Informática y en la Facultad de Computación Schwarzman del MIT. Su investigación se extiende entre la ingeniería química y la informática, ya que desarrolla e implementa modelos computacionales para analizar una gran cantidad de posibles compuestos químicos, diseñar nuevos compuestos y predecir vías de reacción que podrían generar esos compuestos.

“Es un enfoque muy general que podría aplicarse a cualquier aplicación de moléculas orgánicas, pero la aplicación principal en la que pensamos es el descubrimiento de fármacos de molécula pequeña”, afirma.

La intersección de la IA y la ciencia

El interés de Coley por la ciencia viene de familia. De hecho, dice, su familia incluye más científicos que no científicos, incluido su padre, radiólogo; su madre, que obtuvo una licenciatura en biofísica molecular y bioquímica antes de ir a la MIT Sloan School of Management; y su abuela, profesora de matemáticas.

Como estudiante de secundaria en Dublin, Ohio, Coley participó en competencias de la Olimpiada de Ciencias y se graduó de la escuela secundaria a la edad de 16 años. Luego se dirigió a Caltech, donde eligió ingeniería química como especialidad porque le ofrecía una manera de combinar sus intereses en ciencias y matemáticas.

Durante sus años universitarios, también se interesó por la informática y trabajó en un laboratorio de biología estructural utilizando el lenguaje de programación Fortran para ayudar a resolver la estructura cristalina de las proteínas. Después de graduarse de Caltech, decidió continuar con la ingeniería química y llegó al MIT en 2014 para comenzar un doctorado.

Asesorado por los profesores Klavs Jensen y William Green, Coley trabajó en formas de optimizar las reacciones químicas automatizadas. Su trabajo se centró en combinar el aprendizaje automático y la quimioinformática (la aplicación de métodos computacionales para analizar datos químicos) para planificar vías de reacción que podrían generar nuevas moléculas de fármacos. También trabajó en el diseño de hardware que podría usarse para realizar esas reacciones automáticamente.

Parte de ese trabajo se realizó a través de un programa financiado por DARPA llamado Make-It, que se centró en utilizar el aprendizaje automático y la ciencia de datos para mejorar la síntesis de medicamentos y otros compuestos útiles a partir de bloques de construcción simples.

“Ese fue mi verdadero punto de partida para pensar en quimioinformática, pensar en el aprendizaje automático y pensar en cómo podemos usar modelos para comprender cómo se pueden producir diferentes sustancias químicas y qué reacciones son posibles”, dice Coley.

Coley comenzó a postularse para puestos docentes cuando aún era estudiante de posgrado y aceptó una oferta del MIT a los 25 años. Recibió una combinación de consejos a favor y en contra de aceptar un trabajo en la misma escuela donde fue a la escuela de posgrado y, finalmente, decidió que un puesto en el MIT era demasiado atractivo para rechazarlo.

“El MIT es un lugar muy especial en términos de recursos y fluidez entre departamentos. El MIT parecía estar haciendo un muy buen trabajo apoyando la intersección de la IA y la ciencia, y era un ecosistema vibrante en el que permanecer”, afirma. “El calibre de los estudiantes, el entusiasmo de los estudiantes y la increíble fuerza de las colaboraciones definitivamente superaron cualquier preocupación potencial de permanecer en el mismo lugar”.

Intuición química

Coley aplazó el puesto de profesor durante un año para realizar un posdoctorado en el Broad Institute, donde buscó más experiencia en biología química y descubrimiento de fármacos. Allí, trabajó en formas de identificar moléculas pequeñas, a partir de miles de millones de candidatos en bibliotecas codificadas por ADN, que podrían tener interacciones de unión con proteínas mutadas asociadas con enfermedades.

Después de regresar al MIT en 2020, creó su grupo de laboratorio con la misión de implementar IA no solo para sintetizar compuestos existentes con potencial terapéutico, sino también para diseñar nuevas moléculas con propiedades deseables y nuevas formas de producirlas. En los últimos años, su laboratorio ha desarrollado una variedad de enfoques computacionales para abordar esos objetivos.

“Tratamos de pensar en cómo combinar mejor un desafío en química con una posible solución computacional. Y a menudo esa combinación motiva el desarrollo de nuevos métodos”, dice Coley. Un modelo que ha desarrollado su laboratorio, conocido como ShEPhERD, fue entrenado para evaluar posibles nuevas moléculas de fármacos en función de cómo interactuarán con las proteínas objetivo, basándose en las formas tridimensionales de las moléculas del fármaco. Este modelo lo están utilizando ahora las empresas farmacéuticas para ayudarles a descubrir nuevos fármacos.

“Estamos tratando de darle más intuición de química medicinal al modelo generativo, para que el modelo tenga en cuenta los criterios y consideraciones correctos”, dice Coley.

En otro proyecto, el laboratorio de Coley desarrolló un modelo de IA generativo llamado FlowER, que puede usarse para predecir los productos de reacción que resultarán de la combinación de diferentes insumos químicos.

Al diseñar ese modelo, los investigadores lograron comprender los principios físicos fundamentales, como la ley de conservación de la masa. También obligaron al modelo a considerar la viabilidad de los pasos intermedios que deben tener lugar en el camino de los reactivos a los productos. Los investigadores descubrieron que estas limitaciones mejoraron la precisión de las predicciones del modelo.

“Pensar en esos pasos intermedios, los mecanismos implicados y cómo evoluciona la reacción es algo que los químicos hacen de forma muy natural. Así es como se enseña la química, pero no es algo en lo que los modelos piensen inherentemente”, dice Coley. “Hemos pasado mucho tiempo pensando en cómo asegurarnos de que nuestros modelos de aprendizaje automático se basen en la comprensión de los mecanismos de reacción, de la misma manera que lo haría un químico experto”.

Los estudiantes de su laboratorio también trabajan en muchas áreas diferentes relacionadas con la optimización de reacciones químicas, incluida la elucidación de estructuras asistida por computadora, la automatización de laboratorio y el diseño experimental óptimo.

“A través de estos diferentes hilos de investigación, esperamos avanzar en la frontera de la IA en la química”, dice Coley.