Modelos de idiomas grandes (LLM) son la base de los sistemas de múltiples agentes, permitiendo que múltiples agentes de IA colaboren, se comuniquen y resuelvan problemas. Estos agentes usan LLM para comprender las tareas, generar respuestas y tomar decisiones, imitar el trabajo en equipo entre los humanos. Sin embargo, la eficiencia se retrasa al ejecutar este tipo de sistemas, ya que se basan en diseños fijos que no cambian para todas las tareas, lo que hace que usen demasiados recursos para tratar problemas simples y complejos, desperdiciando el cálculo y lo que lleva a una respuesta lenta . Esto, por lo tanto, crea desafíos importantes al tratar de equilibrar la precisión, la velocidad y el costo al manejar tareas diversificadas.

Actualmente, los sistemas de múltiples agentes dependen de métodos existentes como Camel, Autógeno, Metagpt, DSPY, Evoprompting, GPTSWarm, y Evoagenteque se centran en optimizar tareas específicas, como un ajuste rápido, el perfil de agente y la comunicación. Sin embargo, estos métodos luchan con la adaptabilidad. Siguen diseños pre-fijos sin ajustes a diversas tareas, por lo que manejar consultas complejas y simples es algo ineficiente. Carecen de flexibilidad a través de enfoques manuales, mientras que un sistema automatizado solo puede orientar la búsqueda de la mejor configuración sin un reajuste dinámico hacia la eficiencia. Esto hace que estos métodos sean costosos en el cálculo y resulte en un rendimiento general más bajo cuando se aplica a los desafíos del mundo real.

Para abordar las limitaciones de los sistemas de múltiples agentes existentes, los investigadores propusieron MAAS (búsqueda de arquitectura de múltiples agentes). Este marco utiliza una SuperNet de agente probabilístico para generar arquitecturas múltiples dependientes de la consulta. En lugar de seleccionar un sistema óptimo fijo, Maas Muestras dinámicamente sistemas personalizados de múltiples agentes para cada consulta, equilibrando el rendimiento y el costo computacional. El espacio de búsqueda está definido por operadores de agente, que se basan en flujos de trabajo basados ​​en LLM que involucran múltiples agentes, herramientas y indicaciones. El SuperNet aprende una distribución sobre posibles arquitecturas de agente, optimizándola en función de la utilidad de las tareas y las limitaciones de costos. Una red de controlador muestras arquitecturas condicionadas en la consulta, utilizando un Mezcla de expertos (MOE)-El Mecanismo de estilo para una selección eficiente. El marco realiza la optimización a través de un costo empírico Bayes Monte Carloactualización de los operadores de agente utilizando métodos textuales basados ​​en gradientes. El marco proporciona evolución automatizada de agentes múltiples, lo que permite la eficiencia y la adaptabilidad al manejar consultas diversas y complejas.

Los investigadores evaluaron MaaS en seis puntos de referencia públicos a través del razonamiento matemático (GSM8K, Matemáticas, Multiarith), Generación de código (Humaneval, MBPP), y Uso de herramientas (Gaia)comparándolo con 14 líneas de baseincluidos métodos de agentes individuales, sistemas de agentes múltiples hechos a mano y enfoques automatizados. MAAS superó constantemente todas las líneas de base, logrando un mejor puntaje promedio de 83.59% a través de tareas y una mejora significativa de 18.38% en Gaia Nivel 1 tareas. El análisis de costos mostró que MAAS es eficiente en recursos, lo que requiere la menor capacitación de tokens, los costos de API más bajos y el tiempo de pared más corto. Los estudios de casos destacaron su adaptabilidad para optimizar dinámicamente los flujos de trabajo de múltiples agentes.

En resumen, el método solucionó problemas en los sistemas tradicionales de agentes múltiples utilizando una superneta de agente que se ajustaba a diferentes consultas. Esto hizo que el sistema funcionara mejor, use los recursos sabiamente y se vuelva más flexible y escalable. En el trabajo futuro, Maas puede convertirse en un marco flexible pero extendido para mejorar la automatización y la autoorganización en el trabajo futuro. El trabajo futuro también puede ver optimizaciones en las estrategias de muestreo, mejoras en la adaptabilidad del dominio e incorporación de restricciones del mundo real para impulsar la inteligencia colectiva.


Verificar el Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos Gorjeo y únete a nuestro Canal de telegrama y LinkedIn GRsalpicar. No olvides unirte a nuestro 75k+ ml de subreddit.

🚨 Plataforma de IA de código abierto recomendada: ‘Intellagent es un marco múltiple de código abierto para evaluar el complejo sistema de IA conversacional(Promocionado)


Divyesh es un pasante de consultoría en MarktechPost. Está buscando un BTech en ingeniería agrícola y alimentaria del Instituto Indio de Tecnología, Kharagpur. Es un entusiasta de la ciencia de datos y el aprendizaje automático que quiere integrar estas tecnologías líderes en el dominio agrícola y resolver desafíos.

Por automata