La investigación científica en campos como la química, la biología y la inteligencia artificial se ha basado durante mucho tiempo en los expertos humanos para explorar conocimiento, generar ideas, diseñar experimentos y refinar los resultados. Sin embargo, a medida que los problemas se vuelven más complejos e intensivos en datos, el descubrimiento se ralentiza. Si bien las herramientas de IA, como los modelos de lenguaje y la robótica, pueden manejar tareas específicas, como búsquedas de literatura o análisis de código, rara vez abarcan todo el ciclo de investigación. Pinchar la brecha entre la generación de ideas y la validación experimental sigue siendo un desafío clave. Para que la IA avance de la ciencia autónoma, debe proponer hipótesis, diseñar y ejecutar experimentos, analizar los resultados y refinar los enfoques en un bucle iterativo. Sin esta integración, la IA corre el riesgo de producir ideas desconectadas que dependen de la supervisión humana para la validación.
Antes de la introducción de un sistema unificado, los investigadores se basaron en herramientas separadas para cada etapa del proceso. Los modelos de lenguaje grande podrían ayudar a encontrar artículos científicos relevantes, pero no se alimentaron directamente con el diseño del experimento o el análisis de resultados. La robótica puede ayudar a automatizar experimentos físicos, y las bibliotecas de codificación como Pytorch pueden ayudar a construir modelos; Sin embargo, estas herramientas funcionan independientemente entre sí. No había un sistema único capaz de manejar todo el proceso, desde formar ideas hasta verificarlas a través de experimentos. Esto condujo a cuellos de botella, donde los investigadores tenían que conectar los puntos manualmente, desacelerando el progreso y dejando espacio para errores o oportunidades perdidas. La necesidad de un sistema integrado que podría manejar todo el ciclo de investigación se hizo evidente.
Investigadores del equipo de novelas en el Laboratorio de Inteligencia Artificial de Shanghai se desarrollaron Novedosoun sistema de IA diseñado para ejecutar todo el proceso de descubrimiento científico de forma autónoma. Novelseek comprende cuatro módulos principales que funcionan en conjunto: un sistema que genera y refina ideas de investigación, un ciclo de retroalimentación donde los expertos humanos pueden interactuar y refinar estas ideas, un método para traducir ideas en planes de código y experimento, y un proceso para realizar múltiples rondas de experimentos. Lo que hace que NoVeek se destaque es su versatilidad; Funciona en 12 tareas de investigación científica, incluida la predicción de rendimientos de reacción química, comprensión de la dinámica molecular, los datos de la serie de tiempo de pronóstico y las funciones de manejo como la segmentación semántica 2D y la clasificación de objetos 3D. El equipo diseñó novelas para minimizar la participación humana, acelerar los descubrimientos y ofrecer resultados consistentes y de alta calidad.
El sistema detrás de Novelseek involucra múltiples agentes especializados, cada uno centrado en una parte específica del flujo de trabajo de investigación. El “agente de la encuesta” ayuda al sistema a comprender el problema buscando documentos científicos e identificando información relevante basada en palabras clave y definiciones de tareas. Adapta su estrategia de búsqueda haciendo una encuesta amplia de documentos, luego profundizando al analizar documentos de texto completo para obtener información detallada. Esto asegura que el sistema capture tanto tendencias generales como conocimiento técnico específico. El “Agente de revisión de código” examina las bases de código existentes, ya sea que supieran o se obtienen de repositorios públicos como GitHub, para comprender cómo funcionan los métodos actuales e identifican las áreas de mejora. Verifica cómo se estructura el código, busca errores y crea resúmenes que ayudan al sistema a construir sobre el trabajo pasado. El “Agente de innovación de ideas” genera ideas de investigación creativa, impulsando el sistema a explorar diferentes enfoques y refinarlas comparándolas con estudios relacionados y resultados anteriores. El sistema incluso incluye un “agente de planificación y ejecución” que convierte las ideas en experimentos detallados, maneja errores durante el proceso de prueba y garantiza una ejecución sin problemas de planes de investigación de múltiples pasos.
Novelseek entregó resultados impresionantes en varias tareas. En la predicción del rendimiento de la reacción química, la novela mejoró el rendimiento de una línea de base de 24.2% (con una variación de ± 4.2) al 34.8% (con una variación mucho menor de ± 1.1) en solo 12 horas, progresos que los investigadores humanos generalmente necesitan meses para lograr. En la predicción de la actividad potenciadora, una tarea clave en biología, Novelseek elevó el coeficiente de correlación de Pearson de 0.65 a 0.79 en 4 horas. Para la segmentación semántica 2D, una tarea utilizada en la visión por computadora, la precisión mejoró de 78.8% a 81.0% en solo 30 horas. Estos aumentos de rendimiento, logrados en una fracción del tiempo que generalmente se necesita, resaltan la eficiencia del sistema. Novelseek también administró con éxito las bases de código grandes y complejas con múltiples archivos, lo que demuestra su capacidad para manejar tareas de investigación a nivel de proyecto, no solo en pequeñas pruebas aisladas. El equipo ha realizado el código de código abierto, permitiendo que otros usen, prueben y contribuyan a su mejora.
Varias conclusiones clave de la investigación sobre novelas incluyen:
- Novelseek apoya 12 tareas de investigación, incluida la predicción de la reacción química, la dinámica molecular y la clasificación de objetos 3D.
- La precisión de predicción del rendimiento de reacción mejoró de 24.2% a 34.8% en 12 horas.
- El rendimiento de la predicción de la actividad potenciadora aumentó de 0.65 a 0.79 en 4 horas.
- La precisión de segmentación semántica 2D mejoró de 78.8% a 81.0% en 30 horas.
- Novelseek incluye agentes para la búsqueda de literatura, análisis de código, generación de ideas y ejecución del experimento.
- El sistema es de código abierto, lo que permite la reproducibilidad y la colaboración en los campos científicos.
En conclusión, Novelseek demuestra cómo combinar las herramientas de IA en un solo sistema puede acelerar el descubrimiento científico y reducir su dependencia del esfuerzo humano. Se une los pasos clave, generando ideas, convertirlas en métodos y probarlos a través de experimentos, en un proceso simplificado. Lo que una vez llevó a los investigadores meses o años ahora se puede hacer en días o incluso horas. Al vincular cada etapa de investigación en un bucle continuo, Novelseek ayuda a los equipos a pasar de ideas difíciles a resultados del mundo real más rápidamente. Este sistema destaca el poder de la IA no solo para ayudar, sino también para impulsar la investigación científica de una manera que podría remodelar cómo se realizan los descubrimientos en muchos campos.
Mira el Papel y Página de Github . Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 95k+ ml de subreddit y suscribirse a Nuestro boletín.
Nikhil es consultor interno en MarktechPost. Está buscando un doble grado integrado en materiales en el Instituto Indio de Tecnología, Kharagpur. Nikhil es un entusiasta de AI/ML que siempre está investigando aplicaciones en campos como biomateriales y ciencias biomédicas. Con una sólida experiencia en la ciencia material, está explorando nuevos avances y creando oportunidades para contribuir.