Más de 300 personas del mundo académico y de la industria acudieron a un auditorio para asistir a un seminario de BoltzGen el jueves 30 de octubre, organizado por la Clínica Abdul Latif Jameel para el Aprendizaje Automático en Salud (Clínica MIT Jameel). Encabezando el evento estuvo el estudiante de doctorado del MIT y primer autor de BoltzGen, Hannes Stärk, quien había anunciado BoltzGen apenas unos días antes.
Sobre la base de Boltz-2, un modelo de predicción de estructuras biomoleculares de código abierto que predice la afinidad de unión a proteínas que causó sensación durante el verano, BoltzGen (lanzado oficialmente el domingo 26 de octubre) es el primer modelo de este tipo que va un paso más allá al generar nuevos aglutinantes de proteínas que están listos para ingresar al proceso de descubrimiento de fármacos.
Tres innovaciones clave lo hacen posible: primero, la capacidad de BoltzGen para llevar a cabo una variedad de tareas, unificando el diseño de proteínas y la predicción de estructuras mientras mantiene un rendimiento de última generación. A continuación, las restricciones integradas de BoltzGen se diseñan con la retroalimentación de los colaboradores del laboratorio húmedo para garantizar que el modelo cree proteínas funcionales que no desafíen las leyes de la física o la química. Por último, un riguroso proceso de evaluación prueba el modelo en objetivos de enfermedades “no farmacológicas”, superando los límites de las capacidades de generación de aglutinantes de BoltzGen.
La mayoría de los modelos utilizados en la industria o el mundo académico son capaces de predecir estructuras o diseñar proteínas. Además, se limitan a generar ciertos tipos de proteínas que se unen con éxito a “objetivos” fáciles. Al igual que los estudiantes que responden a una pregunta de prueba que se parece a su tarea, siempre que los datos de entrenamiento sean similares al objetivo durante el diseño de la carpeta, los modelos a menudo funcionan. Pero los métodos existentes casi siempre se evalúan en objetivos para los cuales ya existen estructuras con aglutinantes, y terminan fallando en su rendimiento cuando se usan en objetivos más desafiantes.
“Ha habido modelos que intentan abordar el diseño de carpetas, pero el problema es que estos modelos son específicos de cada modalidad”, señala Stärk. “Un modelo general no sólo significa que podemos abordar más tareas. Además, obtenemos un mejor modelo para la tarea individual, ya que la emulación de la física se aprende con el ejemplo, y con un esquema de entrenamiento más general, proporcionamos más ejemplos que contienen patrones físicos generalizables”.
Los investigadores de BoltzGen hicieron todo lo posible para probar BoltzGen en 26 objetivos, desde casos terapéuticamente relevantes hasta aquellos elegidos explícitamente por su diferencia con los datos del entrenamiento.
Este proceso de validación integral, que tuvo lugar en ocho laboratorios húmedos de la academia y la industria, demuestra la amplitud y el potencial del modelo para el desarrollo de fármacos innovadores.
Parabilis Medicines, uno de los colaboradores de la industria que probó BoltzGen en un entorno de laboratorio húmedo, elogió el potencial de BoltzGen: “sentimos que la adopción de BoltzGen en las capacidades de nuestra plataforma computacional de péptidos Helicon existente promete acelerar nuestro progreso para ofrecer medicamentos transformadores contra las principales enfermedades humanas”.
Si bien los lanzamientos de código abierto de Boltz-1, Boltz-2 y ahora BoltzGen (que se presentó en una vista previa en la Séptima Conferencia de Aprendizaje Automático Molecular el 22 de octubre) brindan nuevas oportunidades y transparencia en el desarrollo de fármacos, también indican que las industrias biotecnológica y farmacéutica pueden necesitar reevaluar sus ofertas.
En medio de los rumores sobre BoltzGen en la plataforma de redes sociales X, Justin Grace, científico principal de aprendizaje automático en LabGenius, planteó una pregunta. “El retraso en el rendimiento de privado a abierto para los sistemas de inteligencia artificial de chat es [seven] meses y cayendo”, escribió Grace en una publicación. “Parece ser aún más corto en el espacio de las proteínas. ¿Cómo podrán las compañías de Binder-as-a-Service [recoup] inversión cuando podemos esperar unos meses para obtener la versión gratuita?
Para los académicos, BoltzGen representa una expansión y aceleración de las posibilidades científicas. “Una pregunta que mis alumnos me hacen a menudo es: ‘¿dónde puede la IA cambiar el juego terapéutico?'”, dice la coautora principal y profesora del MIT Regina Barzilay, líder de la facultad de IA de la Clínica Jameel y filial del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL). “A menos que identifiquemos objetivos no farmacológicos y propongamos una solución, no cambiaremos el juego”, añade. “Aquí se hace hincapié en los problemas no resueltos, lo que distingue el trabajo de Hannes de otros en el campo”.
El coautor principal Tommi Jaakkola, profesor Thomas Siebel de Ingeniería Eléctrica y Ciencias de la Computación, afiliado a la Clínica Jameel y CSAIL, señala que “los modelos como BoltzGen que se lanzan completamente de código abierto permiten esfuerzos comunitarios más amplios para acelerar las capacidades de diseño de fármacos”.
De cara al futuro, Stärk cree que el futuro del diseño biomolecular se verá trastocado por los modelos de IA. “Quiero construir herramientas que nos ayuden a manipular la biología para resolver enfermedades o realizar tareas con máquinas moleculares que ni siquiera hemos imaginado todavía”, dice. “Quiero proporcionar estas herramientas y permitir a los biólogos imaginar cosas en las que ni siquiera habían pensado antes”.