El uso de la IA para agilizar el descubrimiento de fármacos está en auge. Los investigadores están implementando modelos de aprendizaje automático para ayudarlos a identificar moléculas, entre miles de millones de opciones, que podrían tener las propiedades que buscan para desarrollar nuevos medicamentos.
Pero hay tantas variables que considerar (desde el precio de los materiales hasta el riesgo de que algo salga mal) que incluso cuando los científicos usan IA, sopesar los costos de sintetizar los mejores candidatos no es una tarea fácil.
Los innumerables desafíos que implica identificar las mejores y más rentables moléculas para probar son una de las razones por las que se tarda tanto en desarrollar nuevos medicamentos, así como un factor clave de los altos precios de los medicamentos recetados.
Para ayudar a los científicos a tomar decisiones conscientes de los costos, los investigadores del MIT desarrollaron un marco algorítmico para identificar automáticamente los candidatos moleculares óptimos, lo que minimiza el costo sintético y maximiza la probabilidad de que los candidatos tengan las propiedades deseadas. El algoritmo también identifica los materiales y los pasos experimentales necesarios para sintetizar estas moléculas.
Su marco cuantitativo, conocido como flujo de trabajo de optimización de rutas basado en recompensas y planificación de síntesis (SPARROW), considera los costos de sintetizar un lote de moléculas a la vez, ya que a menudo se pueden derivar múltiples candidatos de algunos de los mismos compuestos químicos.
Además, este enfoque unificado captura información clave sobre diseño molecular, predicción de propiedades y planificación de síntesis de repositorios en línea y herramientas de inteligencia artificial ampliamente utilizadas.
Más allá de ayudar a las empresas farmacéuticas a descubrir nuevos medicamentos de manera más eficiente, SPARROW podría usarse en aplicaciones como la invención de nuevos agroquímicos o el descubrimiento de materiales especializados para la electrónica orgánica.
“La selección de compuestos es en gran medida un arte en este momento y, en ocasiones, es un arte con mucho éxito. Pero como tenemos todos estos otros modelos y herramientas predictivas que nos brindan información sobre cómo podrían funcionar las moléculas y cómo podrían sintetizarse, podemos y debemos usar esa información para guiar las decisiones que tomamos”, dice Connor Coley, del grupo de 1957 Profesor asistente de desarrollo profesional en los departamentos de Ingeniería Química, Ingeniería Eléctrica y Ciencias de la Computación del MIT, y autor principal de un artículo sobre SPARROW.
A Coley se une en el artículo la autora principal Jenna Fromer SM ’24. La investigación aparece hoy en Ciencia Computacional de la Naturaleza.
Consideraciones de costos complejas
En cierto sentido, si un científico debe sintetizar y probar una determinada molécula se reduce a una cuestión de costo de síntesis versus valor del experimento. Sin embargo, determinar el costo o el valor son problemas difíciles por sí solos.
Por ejemplo, un experimento podría requerir materiales costosos o podría tener un alto riesgo de fracaso. Por el lado del valor, uno podría considerar cuán útil sería conocer las propiedades de esta molécula o si esas predicciones conllevan un alto nivel de incertidumbre.
Al mismo tiempo, las empresas farmacéuticas utilizan cada vez más la síntesis por lotes para mejorar la eficiencia. En lugar de probar moléculas una a la vez, utilizan combinaciones de componentes químicos para probar múltiples candidatos a la vez. Sin embargo, esto significa que todas las reacciones químicas deben requerir las mismas condiciones experimentales. Esto hace que estimar el costo y el valor sea aún más desafiante.
SPARROW aborda este desafío considerando los compuestos intermediarios compartidos involucrados en la síntesis de moléculas e incorporando esa información en su función de costo versus valor.
«Cuando piensas en este juego de optimización de diseñar un lote de moléculas, el costo de agregar una nueva estructura depende de las moléculas que ya has elegido», dice Coley.
El marco también considera aspectos como los costos de los materiales de partida, la cantidad de reacciones involucradas en cada ruta sintética y la probabilidad de que esas reacciones tengan éxito en el primer intento.
Para utilizar SPARROW, un científico proporciona un conjunto de compuestos moleculares que está pensando en probar y una definición de las propiedades que espera encontrar.
A partir de ahí, SPARROW recopila información sobre las moléculas y sus rutas sintéticas y luego compara el valor de cada una con el costo de sintetizar un lote de candidatos. Selecciona automáticamente el mejor subconjunto de candidatos que cumplen con los criterios del usuario y encuentra las rutas sintéticas más rentables para esos compuestos.
«Hace toda esta optimización en un solo paso, por lo que realmente puede capturar todos estos objetivos en competencia simultáneamente», dice Fromer.
Un marco versátil
SPARROW es único porque puede incorporar estructuras moleculares diseñadas a mano por humanos, aquellas que existen en catálogos virtuales o moléculas nunca antes vistas que han sido inventadas mediante modelos generativos de IA.
“Tenemos todas estas diferentes fuentes de ideas. Parte del atractivo de SPARROW es que puedes tomar todas estas ideas y ponerlas en igualdad de condiciones”, añade Coley.
Los investigadores evaluaron SPARROW aplicándolo en tres estudios de caso. Los estudios de caso, basados en problemas del mundo real que enfrentan los químicos, fueron diseñados para probar la capacidad de SPARROW para encontrar planes de síntesis rentables mientras trabaja con una amplia gama de moléculas de entrada.
Descubrieron que SPARROW captó eficazmente los costos marginales de la síntesis por lotes e identificó pasos experimentales comunes y productos químicos intermedios. Además, podría ampliarse para manejar cientos de posibles candidatos moleculares.
“En la comunidad de aprendizaje automático para química, hay muchísimos modelos que funcionan bien para la retrosíntesis o la predicción de propiedades moleculares, por ejemplo, pero ¿cómo los utilizamos realmente? Nuestro marco pretende resaltar el valor de este trabajo previo. Con la creación de SPARROW, esperamos que podamos guiar a otros investigadores a pensar en la selección descendente de compuestos utilizando sus propias funciones de costo y utilidad”, afirma Fromer.
En el futuro, los investigadores quieren incorporar complejidad adicional a SPARROW. Por ejemplo, les gustaría permitir que el algoritmo considere que el valor de probar un compuesto puede no ser siempre constante. También quieren incluir más elementos de química paralela en su función de costo versus valor.
“El trabajo de Fromer y Coley alinea mejor la toma de decisiones algorítmicas con las realidades prácticas de la síntesis química. Cuando se utilizan algoritmos de diseño computacional existentes, el trabajo de determinar cómo sintetizar mejor el conjunto de diseños se deja al químico medicinal, lo que resulta en elecciones menos óptimas y trabajo adicional para el químico medicinal”, dice Patrick Riley, vicepresidente senior de artificial. inteligencia en Relay Therapeutics, que no participó en esta investigación. «Este artículo muestra un camino basado en principios para incluir la consideración de la síntesis conjunta, que espero que dé como resultado diseños algorítmicos de mayor calidad y más aceptados».
“Identificar qué compuestos sintetizar de una manera que equilibre cuidadosamente el tiempo, el costo y el potencial para avanzar hacia los objetivos y al mismo tiempo proporcionar nueva información útil es una de las tareas más desafiantes para los equipos de descubrimiento de fármacos. El enfoque SPARROW de Fromer y Coley hace esto de una manera eficaz y automatizada, proporcionando una herramienta útil para los equipos de química medicinal humana y dando pasos importantes hacia enfoques totalmente autónomos para el descubrimiento de fármacos”, añade John Chodera, químico computacional del Memorial Sloan Kettering Cancer. Center, que no participó en este trabajo.
Esta investigación fue apoyada, en parte, por el Programa de Descubrimiento Molecular Acelerado de DARPA, la Oficina de Investigación Naval y la Fundación Nacional de Ciencias.