LAMBDA: un nuevo sistema de análisis de datos multiagente, de código abierto y sin código, para cerrar la brecha entre los expertos del sector y los modelos de IA avanzados

En la última década, el método basado en datos que utiliza redes neuronales profundas ha impulsado el éxito de la inteligencia artificial en diversas aplicaciones desafiantes en diferentes campos. Estos avances abordan múltiples problemas; sin embargo, las metodologías existentes enfrentan el desafío en las aplicaciones de ciencia de datos, especialmente en campos como la biología, la atención médica y los negocios debido al requisito de una gran experiencia y habilidades de codificación avanzadas. Además, una barrera importante en este campo es la falta de comunicación entre los expertos del dominio y los modelos avanzados de inteligencia artificial.

En los últimos años, el rápido progreso de los modelos de lenguaje grandes (LLM, por sus siglas en inglés) ha abierto muchas posibilidades en el campo de la inteligencia artificial. Algunos de los LLM más conocidos son GPT-3, GPT-4, PaLM, LLaMA y Qwen. Estos modelos tienen un gran potencial para comprender, generar y aplicar el lenguaje natural. Estos avances han creado un medio para los agentes impulsados ​​por LLM que ahora se están desarrollando para resolver problemas en motores de búsqueda, ingeniería de software, juegos, sistemas de recomendación y experimentos científicos. Estos agentes suelen estar guiados por una cadena de pensamiento (CoT, por sus siglas en inglés) como ReAct y pueden utilizar herramientas como API, intérpretes de código y recuperadores. Los métodos analizados en este artículo incluyen (a) la mejora de los LLM con llamadas de función y (b) la potenciación de los LLM mediante intérpretes de código.

Un equipo de investigadores de la Universidad Politécnica de Hong Kong ha presentado LAMBDA, un nuevo sistema de análisis de datos multiagente de código abierto y sin código desarrollado para superar la falta de comunicación efectiva entre los expertos del dominio y los modelos avanzados de IA. LAMBDA proporciona un medio esencial que permite una interacción fluida entre el conocimiento del dominio y las capacidades de IA en la ciencia de datos. Este método resuelve numerosos problemas, como la eliminación de las barreras de codificación, la integración de la inteligencia humana con la IA y la remodelación de la educación en ciencia de datos, prometiendo confiabilidad y portabilidad. La confiabilidad significa que LAMBDA puede abordar las tareas de análisis de datos de manera estable y correcta. La portabilidad significa que es compatible con varios LLM, lo que permite mejorarlo con los últimos modelos de vanguardia.

El método propuesto, LAMBDA, un sistema de análisis de datos multiagente, contiene dos agentes que trabajan juntos para resolver tareas de análisis de datos utilizando lenguaje natural. El proceso comienza con la escritura de código basado en instrucciones del usuario y luego la ejecución de ese código. Los dos roles principales de LAMBDA son el de “programador” y el de “inspector”. El programador escribe código de acuerdo con las instrucciones del usuario y el conjunto de datos. Luego, este código se ejecuta en el sistema host. Si el código encuentra algún error durante la ejecución, el inspector cumple la función de sugerir mejoras. El programador usa estas sugerencias para corregir el código y enviarlo para su reevaluación.

Los resultados de los experimentos muestran que LAMBDA funciona bien en tareas de aprendizaje automático. Logró las tasas de precisión más altas de 89,67 %, 100 %, 98,07 % y 98,89 % para los conjuntos de datos de SIDA, NHANES, Cáncer de mama y Vino, respectivamente, para tareas de clasificación. Para tareas de regresión, logró el MSE (error cuadrático medio) más bajo de 0,2749, 0,0315, 0,4542 y 0,2528, respectivamente. Estos resultados resaltan su eficacia en el manejo de varios modelos de aplicaciones de ciencia de datos. Además, LAMBDA superó con éxito la barrera de codificación sin ninguna participación humana en todo el proceso de estos experimentos y conectó la ciencia de datos con expertos humanos que carecen de habilidades de codificación.

En este artículo, un equipo de investigadores de la Universidad Politécnica de Hong Kong ha propuesto un nuevo sistema de análisis de datos multiagente, de código abierto y sin código, llamado LAMBDA, que combina la inteligencia humana con la IA. Los resultados experimentales muestran que funciona bien en tareas de análisis de datos. En el futuro, se puede mejorar con técnicas de planificación y razonamiento. Ha cerrado la brecha entre la ciencia de datos y los humanos sin habilidades de codificación, conectándolos con éxito sin la participación humana. Al cerrar la brecha entre la experiencia humana y las capacidades de la IA, LAMBDA tiene como objetivo hacer que la ciencia de datos y el análisis sean más accesibles, fomentando más innovación y descubrimiento en el futuro.


Revisar la Papel, Proyectoy GitHubTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Más de 47 000 suscriptores de ML en Reddit

Encuentra lo próximo Seminarios web sobre IA aquí


Sajjad Ansari es un estudiante de último año de la carrera de IIT Kharagpur. Como entusiasta de la tecnología, se adentra en las aplicaciones prácticas de la IA, centrándose en comprender el impacto de las tecnologías de IA y sus implicaciones en el mundo real. Su objetivo es articular conceptos complejos de IA de una manera clara y accesible.