Investigadores de la Universidad de Fudan y el Laboratorio de IA de Shanghai presentan DOLPHIN: un marco de circuito cerrado para automatizar la investigación científica con retroalimentación iterativa

La Inteligencia Artificial (IA) está revolucionando la forma en que se realizan los descubrimientos. La IA está creando un nuevo paradigma científico con la aceleración de procesos como el análisis de datos, la computación y la generación de ideas. Los investigadores quieren crear un sistema que eventualmente aprenda a evitar a los humanos por completo completando el ciclo de investigación sin participación humana. Estos avances podrían aumentar la productividad y acercar a las personas a desafíos difíciles.

El proceso de generación de hipótesis, ejecución de experimentos y validación de datos a menudo resulta ineficiente ya que la investigación científica involucra elementos humanos. Las soluciones innovadoras se ven obstaculizadas por el progreso evolutivo, ya que las ideas no pueden perfeccionarse con mecanismos de retroalimentación iterativos durante la experimentación. No se puede subestimar la importancia de este aspecto, ya que contribuye a lograr hallazgos más rápidos y precisos en los estudios científicos.

Se han desarrollado varios entornos de investigación para automatizar parcialmente el proceso de investigación. Herramientas como GPT-researcher y AI-Scientist pueden dividir las tareas en subtareas más simples, ayudar a generar ideas y realizar algún tipo de cálculo. Sin embargo, no existe un marco general integrado que incluya la retroalimentación experimental dentro del ciclo de investigación. Además, la mayoría de las herramientas actuales dependen de pequeños conjuntos de datos o flujos de trabajo predefinidos, lo que limita su capacidad para ejecutar tareas de investigación abiertas.

La Universidad de Fudan y el Laboratorio de Inteligencia Artificial de Shanghai han desarrollado DOLPHIN, un marco de investigación automática de circuito cerrado que cubre todo el proceso de investigación científica. El sistema genera ideas, ejecuta experimentos e incorpora comentarios para perfeccionar las iteraciones posteriores. DOLPHIN garantiza una mayor eficiencia y precisión al clasificar la literatura específica de la tarea y emplear procesos de depuración avanzados. Este enfoque integral lo distingue de otras herramientas y lo posiciona como un sistema pionero para la investigación autónoma.

La metodología de DOLPHIN se divide en tres etapas interconectadas. Primero, el sistema recupera y clasifica artículos de investigación relevantes sobre un tema. Los artículos se clasifican según la relevancia para la tarea y los atributos del tema, filtrando así las referencias más aplicables. Utilizando las referencias seleccionadas, DOLPHIN genera ideas de investigación novedosas e independientes. Las ideas generadas se refinan mediante el uso de un modelo de transformador de oraciones, calculando la similitud del coseno y eliminando la redundancia.

Una vez finalizadas las ideas, DOLPHIN pasa a la verificación experimental. Genera y depura código automáticamente mediante un proceso guiado por rastreo de excepciones. Esto implica analizar los mensajes de error y su estructura de código relacionada para realizar correcciones de manera eficiente. Los experimentos se realizan de forma iterativa y los resultados se clasifican como mejoras, mantenimiento o descensos. Los resultados exitosos se incorporan a ciclos futuros, mejorando la calidad de la generación de ideas con el tiempo.

DOLPHIN se probó en tres tareas de referencia: clasificación de imágenes usando CIFAR-100, clasificación de puntos 3D con ModelNet40 y clasificación de sentimientos usando SST-2. En clasificación de imágenes, DOLPHIN mejoró los modelos de referencia como WideResNet hasta en un 0,8 %, logrando una precisión superior del 82,0 %. Para la clasificación de puntos 3D, el sistema superó a los métodos diseñados por humanos como PointNet, logrando una precisión general del 93,9 %, una mejora del 2,9 % con respecto a los modelos de referencia. En la clasificación de sentimientos, DOLPHIN mejoró la precisión en un 1,5% para cerrar la brecha entre el rendimiento BERT-base y BERT-large. Estos resultados muestran que DOLPHIN puede producir ideas a la par de métodos de última generación, incluido su desempeño en diversos conjuntos de datos y tareas.

Una característica interesante de DOLPHIN es que mejora la eficiencia en las iteraciones de investigación. En la primera iteración, produjo 20 ideas, de las cuales 19 se consideraron novedosas, a un costo promedio por idea de 0,184 dólares. El sistema de circuito cerrado de DOLPHIN mejoró el procesamiento durante la tercera iteración para mejorar la calidad de las ideas y las tasas de ejecución experimental. La tasa de éxito de la depuración pasó del 33,3 % al 50,0 % después de que se incorporaron comentarios estructurados sobre errores anteriores. Esta mejora iterativa subraya la solidez del diseño de DOLPHIN a la hora de automatizar y optimizar el proceso de investigación.

DOLPHIN representa un importante avance en la investigación impulsada por la IA al abordar ineficiencias clave en los flujos de trabajo científicos tradicionales. Su capacidad para integrar la revisión de la literatura, la generación de ideas, la experimentación y la retroalimentación en un ciclo fluido demuestra su potencial para promover el descubrimiento científico. El marco mejora la eficiencia y logra resultados comparables o superiores a los de los sistemas diseñados por humanos. Esto posiciona a DOLPHIN como una herramienta prometedora para abordar desafíos científicos complejos y fomentar la innovación en diversos ámbitos.

Verificar el Papel y Página del proyecto. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de telegramas y LinkedIn Grarriba. No olvides unirte a nuestro SubReddit de más de 65.000 ml.

🚨 PRÓXIMO SEMINARIO WEB GRATUITO SOBRE IA (15 DE ENERO DE 2025): Aumente la precisión del LLM con datos sintéticos e inteligencia de evaluación–Únase a este seminario web para obtener información práctica para mejorar el rendimiento y la precisión del modelo LLM y, al mismo tiempo, proteger la privacidad de los datos..

Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.

Investigadores de la Universidad de Fudan y el Laboratorio de IA de Shanghai presentan DOLPHIN: un marco de circuito cerrado para automatizar la investigación científica con retroalimentación iterativa

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

El nuevo modelo de IA de DeepSeek se está implementando silenciosamente, sin causar shock en el mercado de Wall Street

Cursor presenta un SDK de TypeScript para crear agentes de codificación programática con máquinas virtuales en la nube protegidas, subagentes, enlaces y precios basados en tokens

IBM lanza dos modelos Granite Speech 4.1 2B: ASR autorregresivo con traducción y edición no autorregresiva para una inferencia rápida

You missed

Los créditos de carbono salvaron los bosques tropicales, pero el exceso de crédito los infló 10 veces

El suministro de combustible para aviones en el Reino Unido aumentó en medio de la interrupción de Ormuz

Monica reacciona a la foto viral de un zapato blanco con IA con Claressa Shields

Dudas sobre la afirmación “descabellada” de que el control magnético puede activar genes