Los modelos de lenguaje grandes (LLM) han demostrado capacidades notables en tareas de comprensión, razonamiento y generación de lenguaje. Los investigadores ahora se están centrando en el desarrollo de agentes autónomos basados en LLM para abordar aplicaciones del mundo real más diversas y complejas. Sin embargo, muchos escenarios del mundo real presentan desafíos que exceden las capacidades de un solo agente. Inspirados por la sociedad humana, donde individuos con características únicas colaboran para manejar misiones complicadas, existe una tendencia creciente a desarrollar marcos de colaboración de múltiples agentes. Estos marcos apuntan a simular comportamientos humanos para resolver tareas complejas utilizando la experiencia especializada de múltiples agentes. A pesar del potencial de los sistemas multiagente, los diseños actuales dependen en gran medida de configuraciones hechas a mano, lo que limita la escalabilidad debido a la costosa mano de obra humana. En consecuencia, la creación de un paradigma de generación de agentes genéricos para construir automáticamente sistemas multiagente ha surgido como un desafío crítico en el campo.
Los intentos existentes para resolver los desafíos de la colaboración entre múltiples agentes se han centrado en el desarrollo de agentes autónomos con habilidades LLM avanzadas como personajes, planificación, uso de herramientas y memoria. Algunos marcos amplían la colaboración entre múltiples agentes mediante el diseño de roles específicos, lo que muestra resultados prometedores para tareas complejas. Sin embargo, la mayoría se basa en gran medida en diseños hechos a mano, lo que limita la adaptabilidad. Estudios recientes demuestran la influencia de los personajes en el rendimiento de los agentes, pero los métodos actuales implican la asignación manual, lo que dificulta la generalización. Los marcos como AgentVerse y AutoAgents apuntan a generar automáticamente agentes para la colaboración, pero aún dependen de intervenciones diseñadas por humanos. Estos enfoques limitan la escalabilidad y la funcionalidad, lo que restringe el alcance de la tarea y resalta la necesidad de métodos automatizados más flexibles.
Investigadores de la Universidad de Fudan y Microsoft Research Asia presentan AGENTE EVOEVOAGENT, un método robusto para la generación de agentes, formula el proceso como un procesamiento evolutivo en la sociedad humana. Este enfoque simula el comportamiento humano para generar automáticamente múltiples agentes basados en agentes predefinidos. A partir de un agente inicial especializado, EVOAGENT evoluciona sus configuraciones a través de una serie de operaciones como selección, cruce y mutación. Este método de generación de agentes de una sola vez puede crear múltiples agentes evolutivos sin esfuerzo humano adicional. EVOAGENT no se limita a marcos de agentes específicos, lo que lo convierte en un método genérico de generación de múltiples agentes aplicable a varios escenarios. Los experimentos realizados en múltiples conjuntos de datos, que incluyen respuesta a preguntas basada en el conocimiento, razonamiento multimodal, resolución científica interactiva y planificación compleja del mundo real, demuestran la capacidad de EVOAGENT para generar diversos agentes con habilidades especializadas, mejorando constantemente el rendimiento del modelo en diferentes escenarios. El método también muestra potencial para generar múltiples agentes diversos para escenarios conversacionales como debates.
EVOAGENT opera a través de un proceso de cuatro etapas que simula el procesamiento evolutivo. El método comienza con un paso de inicialización, utilizando un marco de agente predefinido como agente inicial (principal). En la segunda etapa, se realizan operaciones de cruce y mutación utilizando LLM para generar agentes secundarios con habilidades actualizadas y características diversas. La tercera etapa implica un proceso de selección, donde un módulo de control de calidad garantiza que los agentes generados mantengan las diferencias con los agentes principales y hereden las características clave. Finalmente, la etapa de actualización de resultados integra los resultados de los agentes secundarios con resultados anteriores, mejorando las capacidades de resolución de tareas. Este proceso se puede repetir para generar automáticamente más agentes, extendiendo de manera efectiva los marcos de agentes existentes a sistemas multiagente sin diseño humano adicional. El enfoque evolutivo de EVOAGENT lo hace aplicable a cualquier marco de agente sin requisitos previos.
EVOAGENT demuestra mejoras significativas en varias tareas, incluidas la PNL, el razonamiento multimodal, la resolución interactiva de problemas científicos y los escenarios de planificación del mundo real. En las tareas de PNL y multimodales, EVOAGENT supera de forma consistente a los métodos existentes, como la incitación en cadena de pensamiento, el autoajuste y la incitación de rendimiento individual en diferentes modelos de lenguaje. Por ejemplo, en la tarea Logic Grid Puzzle, EVOAGENT logró una precisión del 77 % con GPT-4, en comparación con el 65,5 % del siguiente mejor método. En el entorno interactivo ScienceWorld, EVOAGENT mejoró el rendimiento de GPT-4 de 27,97 a 30,42 puntos en general. En la planificación del mundo real en TravelPlanner, EVOAGENT mejoró significativamente el rendimiento en todas las métricas, en particular en el cumplimiento de restricciones estrictas y reglas de sentido común. Estos resultados demuestran la versatilidad y la eficacia de EVOAGENT a la hora de generar agentes especializados para diversas tareas, mejorando de forma constante los métodos existentes y mostrando su potencial para la resolución de problemas complejos y escenarios de planificación.
Esta investigación presenta EVOAGENT, un innovador sistema automático de generación de múltiples agentes que utiliza algoritmos evolutivos para mejorar los marcos de agentes existentes. Mediante el empleo de operaciones de mutación, cruce y selección, crea agentes diversos y efectivos sin intervención humana adicional. Los resultados experimentales en diversas tareas demuestran la capacidad de EVOAGENT para mejorar significativamente el rendimiento de los agentes basados en LLM en escenarios complejos de resolución de problemas, lo que muestra su potencial para hacer avanzar los sistemas multiagente en inteligencia artificial.
Revisar la Papel y ProyectoTodo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo.
Únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!.
Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..
No olvides unirte a nuestro Subreddit de más de 46 000 millones de usuarios
Asjad es consultor en prácticas en Marktechpost. Está cursando la licenciatura en ingeniería mecánica en el Instituto Indio de Tecnología de Kharagpur. Asjad es un entusiasta del aprendizaje automático y del aprendizaje profundo que siempre está investigando las aplicaciones del aprendizaje automático en el ámbito de la atención médica.