Conozca el co-científico: un sistema de agentes múltiples alimentado por Gemini 2.0 para acelerar el descubrimiento científico

Los investigadores biomédicos enfrentan un dilema significativo en su búsqueda de avances científicos. La creciente complejidad de los temas biomédicos exige una experiencia profunda y especializada, mientras que las ideas transformadoras a menudo surgen en la intersección de diversas disciplinas. Esta tensión entre la profundidad y la amplitud crea desafíos sustanciales para los científicos que navegan por un volumen exponencialmente creciente de publicaciones y tecnologías especializadas de alto rendimiento. A pesar de estos obstáculos, los principales avances científicos se derivan con frecuencia de enfoques transdisciplinarios, incluido el desarrollo de CRISPR, que ejemplifica este patrón, combinando técnicas de microbiología, genética y biología molecular. Tales ejemplos destacan cómo el cruce de los límites tradicionales puede catalizar el progreso científico, incluso cuando los investigadores luchan por mantener el conocimiento especializado y la conciencia interdisciplinaria.

Los enfoques recientes se centran en desarrollar “modelos de razonamiento” especializados que intenten sobresalir los procesos de pensamiento humano en lugar de simplemente predecir las próximas palabras. El paradigma de la prueba de tiempo de prueba se ha convertido en una dirección prometedora, asignando recursos computacionales adicionales durante la inferencia para permitir el razonamiento deliberado. Este concepto evolucionó a partir de éxitos tempranos como la búsqueda de árboles Monte Carlo de Alphago y se ha expandido a LLM. Al mismo tiempo, la IA ha transformado el descubrimiento científico entre los dominios, ejemplificado por el avance de Alfafold 2 en la predicción de la estructura de proteínas. Los investigadores ahora tienen como objetivo completar la integración de la IA en el flujo de trabajo de investigación y desean establecer la IA como colaborador activo a lo largo del proceso científico, desde la generación de hipótesis hasta la escritura de manuscritos.

Además, han surgido varios sistemas de IA para acelerar el descubrimiento científico en la investigación biomédica. Coscientist, un sistema de agente múltiple alimentado por GPT-4, permite la ejecución autónoma de experimentos químicos a través de capacidades integradas de búsqueda web y ejecución de código. Además, tanto los modelos de propósito general como GPT-4 como LLM biomédicos especializados como Med-Palm han mostrado un rendimiento impresionante en los puntos de referencia de razonamiento biomédico. En la reutilización de fármacos específicamente, los enfoques tradicionales combinan métodos computacionales y experimentales utilizando la comprensión de la interacción con enfermedades por enfermedad. Conocimiento Métodos basados ​​en gráficos como redes convolucionales gráficas y TXGNN muestran prometedor, pero permanecen limitados por la calidad del gráfico de conocimiento, los problemas de escalabilidad y la explicabilidad insuficiente.

Investigadores de Google Cloud AI Research, Google Research, Google Deepmind, Houston Methodist, Sequome, Fleming Initiative y Imperial College London, y la Facultad de Medicina de la Universidad de Stanford han propuesto un co-cientista de IA, un sistema múltiple de agente basado en Gemini 2.0 diseñado para acelerar el descubrimiento científico. Su objetivo es descubrir nuevos conocimientos y generar novedosas hipótesis de investigación alineadas con los objetivos proporcionados por los científicos. Utilizando un enfoque de “generar, debatir y evolucionar”, el co-cientista de IA utiliza escala de cálculo de tiempo de prueba para mejorar la generación de hipótesis. Además, se centra en tres dominios biomédicos: reutilización de drogas, descubrimiento objetivo nuevo y explicación de los mecanismos de evolución bacteriana. Las evaluaciones automatizadas muestran que el aumento del cálculo del tiempo de prueba mejora constantemente la calidad de la hipótesis.

La arquitectura co-cientista de IA integra cuatro componentes esenciales, formando un sistema de investigación integral:

  • La interfaz del lenguaje natural permite a los científicos interactuar con el sistema, definir objetivos de investigación, proporcionar retroalimentación y guiar el progreso a través de las entradas conversacionales.
  • El marco de tareas asíncrono implementa un sistema de múltiples agentes donde los agentes especializados funcionan como procesos de trabajadores dentro de un entorno de ejecución continua.
  • Un agente de supervisor orquesta el marco anterior administrando la cola de tareas de los trabajadores, asignando agentes especializados a los procesos y asignando recursos computacionales.
  • Para habilitar el cálculo iterativo y el razonamiento científico durante los horizontes de tiempo largo, el co-cientista utiliza una memoria de contexto persistente para almacenar y recuperar los estados de los agentes y el sistema durante el cálculo.

En el centro del sistema co-cientista de IA se encuentra una coalición de agentes especializados orquestados por un agente supervisor. Hay múltiples tipos de agentes especializados. Comenzando con el agente de la generación, inicia la investigación creando áreas de enfoque iniciales e hipótesis. Además, el agente de reflexión sirve como revisor de pares, examinando críticamente la calidad de la hipótesis, la corrección y la novedad. El agente de clasificación implementa un sistema de torneo basado en ELO con comparaciones por pares para evaluar y priorizar hipótesis. El agente de proximidad calcula gráficos de similitud para la agrupación de hipótesis, la deduplicación y la exploración eficiente de los paisajes conceptuales. El agente de la evolución refina continuamente las hipótesis de alto rango. Finalmente, el agente de Meta-Review sintetiza las ideas de todas las reseñas y debates de torneo para optimizar el rendimiento del agente en iteraciones posteriores.

El sistema co-científico de IA muestra un fuerte rendimiento en múltiples métricas de evaluación. El análisis utilizando el conjunto de diamantes GPQA muestra la concordancia entre las clasificaciones ELO y la precisión, con el sistema alcanzando el 78.4% de precisión Top-1 seleccionando su resultado mejor calificado para cada pregunta. Además, los modelos de razonamiento más nuevos como Operai O3-Mini-High y Deepseek R1 muestran un rendimiento competitivo con menos computación, mientras que el co-científico no muestra evidencia de saturación de rendimiento, lo que sugiere que una mayor escala podría producir mejoras adicionales. Las evaluaciones de expertos en 11 objetivos de investigación confirman la efectividad del co-científico, con los resultados que reciben la clasificación de preferencia más alta (2.36/5) y la novedad superior (3.64/5) e impacto (3.09/5) calificaciones en comparación con los modelos de referencia.

Los resultados adicionales con el co-científico de IA muestran capacidades significativas en múltiples dominios de investigación biomédica. En la investigación de la fibrosis hepática, cuando se le encarga explorar alteraciones epigenéticas, el sistema genera 15 hipótesis. Estas hipótesis identifican 3 nuevos modificadores epigenéticos como objetivos terapéuticos potenciales, respaldados por evidencia preclínica. Las pruebas posteriores en organoides hepáticos confirman que los medicamentos dirigidos a dos de estos modificadores exhiben actividad antifibrótica sin toxicidad celular. En particular, un compuesto identificado ya está aprobado por la FDA para otra indicación, presentando una oportunidad inmediata de reutilización de fármacos para el tratamiento de la fibrosis hepática. En la investigación de la resistencia a los antimicrobianos, el co-científico sugiere con precisión la investigación de las interacciones de la cola cápsida, alineando con precisión con el descubrimiento de los investigadores de que los CF-PICS interactúan con diversas colas de fagos para expandir su rango de huéspedes.

Este trabajo de investigación también proporciona la limitación que enfrenta el sistema co-cientista de IA:

  • Limitaciones con búsqueda de literatura, revisiones y razonamiento.
  • Falta de acceso a datos de resultados negativos.
  • Capacidades mejoradas de razonamiento multimodal y uso de herramientas.
  • Limitaciones hereditarias de Frontier LLMS.
  • Necesidad de mejores métricas y evaluaciones más amplias.
  • Limitaciones de las validaciones existentes.

El co-científico de IA no está diseñado actualmente para generar diseños integrales de ensayos clínicos o para explicar completamente factores como la biodisponibilidad de los medicamentos, la farmacocinética y cualquier interacción compleja de drogas cuando se aplica a la reutilización o el descubrimiento de los medicamentos.

El sistema co-cientista de IA ofrece numerosas oportunidades para desarrollo futuro en varios frentes. Las mejoras inmediatas deben centrarse en mejorar las revisiones de la literatura, implementar las verificaciones cruzadas de herramientas externas, fortalecer la verificación de factualidad y mejorar el recuerdo de citas para abordar la investigación perdida. Los controles de coherencia también reducirían la carga de revisar las hipótesis defectuosas. Un avance importante implicaría extender más allá del análisis de texto para incorporar imágenes, conjuntos de datos y bases de datos públicas importantes. Por último, la integración con los sistemas de automatización de laboratorio podría crear ciclos de validación de circuito cerrado, mientras que las interfaces de usuario más estructuradas podrían mejorar la eficiencia de colaboración de Human-AI más allá de las interacciones actuales de texto libre.

En conclusiónlos investigadores introdujeron el co-científico de IA, un sistema de múltiples agentes para acelerar el descubrimiento científico a través de sistemas de IA agente. Utilizando su metodología “generar, debate, evolucionar” con agentes especializados que trabajan en concierto, el sistema muestra un potencial notable para aumentar los esfuerzos científicos humanos. La validación experimental a través de múltiples dominios biomédicos confirma su capacidad para generar hipótesis nuevas y comprobables que pueden resistir el escrutinio del mundo real. A medida que los científicos enfrentan desafíos cada vez más complejos en la salud humana, la medicina y los dominios científicos más amplios, los sistemas como el co-científico de IA ofrecen una aceleración significativa de los procesos de descubrimiento. Este desarrollo de IA centrado en los humanos crea nuevas oportunidades para ayudar a los humanos a resolver grandes desafíos científicos de manera eficiente.


Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro Subreddit de 80k+ ml.

🚨 Lectura de lectura recomendada Liberaciones de investigación de IA: un sistema avanzado que integra el sistema de IA del agente y los estándares de cumplimiento de datos para abordar las preocupaciones legales en los conjuntos de datos de IA


Sajjad Ansari es un pregrado de último año de IIT Kharagpur. Como entusiasta de la tecnología, profundiza en las aplicaciones prácticas de la IA con un enfoque en comprender el impacto de las tecnologías de IA y sus implicaciones del mundo real. Su objetivo es articular conceptos complejos de IA de manera clara y accesible.