Screenshot 2024 03 02 At 10.59.58 Pm.png

La integración de modelos de lenguaje grande (LLM) en agentes autónomos promete revolucionar la forma en que abordamos tareas complejas, desde la IA conversacional hasta la generación de código. Un desafío importante reside en el núcleo del avance de los agentes independientes: la naturaleza vasta y variada de los datos. Diversas fuentes aportan una gran cantidad de formatos, lo que complica la tarea de capacitar a los agentes de manera eficiente y efectiva. La heterogeneidad de los datos no sólo plantea un obstáculo en términos de compatibilidad, sino que también afecta la coherencia y la calidad de la formación de los agentes.

Las metodologías existentes, si bien son encomiables, a menudo deben abordar los desafíos multifacéticos que presenta esta diversidad de datos. Los enfoques tradicionales de integración de datos y capacitación de agentes enfrentan limitaciones, lo que resalta la necesidad de una solución más coherente y flexible.

Un equipo de investigadores de Salesforce Research, EE. UU., presentó AgentOhana. Esta solución integral aborda los desafíos de aprovechar el potencial de los LLM para tareas basadas en agentes. Estandariza y unifica las trayectorias de los agentes de diversas fuentes de datos en un formato consistente, optimizando el conjunto de datos para la capacitación de los agentes. La creación de AgentOhana es un paso importante en la consolidación de datos de trayectoria de agentes de LLM de múltiples turnos.

AgentOhana emplea un proceso de capacitación que mantiene el equilibrio entre las fuentes de datos y preserva la aleatoriedad independiente durante la partición del conjunto de datos y el entrenamiento del modelo. La recopilación de datos se somete a un meticuloso proceso de filtrado para garantizar trayectorias de alta calidad, mejorando la calidad general y la confiabilidad de los datos recopilados. AgentOhana proporciona una vista granular de las interacciones de los agentes, los procesos de toma de decisiones y los resultados, lo que permite una comprensión más matizada y una mejora del rendimiento del modelo. Incorpora datos de agentes de diez entornos distintos, lo que facilita un amplio espectro de oportunidades de investigación. También incluye el desarrollo de XLAM-v0.1, un modelo de acción de gran tamaño diseñado para agentes de IA, que demuestra un rendimiento excepcional.

La eficacia de AgentOhana y XLAM-v0.1 es evidente en su desempeño en varios puntos de referencia, incluidos Webshop, HotpotQA, ToolEval y MINT-Bench. AgentOhana logra una alta precisión en el punto de referencia de la tienda web basándose en la superposición de atributos entre los artículos comprados y los reales. Para el punto de referencia HotpotQA, AgentOhana logra una alta precisión en tareas de respuesta a preguntas de múltiples saltos que requieren razonamiento lógico en pasajes de Wikipedia. Estos resultados subrayan la eficacia del enfoque de AgentOhana y ofrecen una visión del futuro del desarrollo de agentes autónomos.

En conclusión, AgentOhana representa un paso significativo hacia la superación de los desafíos de la heterogeneidad de los datos en la formación de agentes autónomos. Al proporcionar un canal unificado de datos y capacitación, esta plataforma mejora la eficiencia y eficacia del aprendizaje de los agentes y abre nuevas vías para la investigación y el desarrollo en inteligencia artificial. Las contribuciones de AgentOhana al avance de los agentes autónomos subrayan el potencial de las soluciones integradas para aprovechar todas las capacidades de los modelos de lenguajes grandes.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y noticias de Google. Unirse nuestro SubReddit de 38k+ ML, 41k+ comunidad de Facebook, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Canal de telegramasTambién te puede gustar nuestro Cursos GRATUITOS de IA….


Nikhil es consultor interno en Marktechpost. Está cursando una doble titulación integrada en Materiales en el Instituto Indio de Tecnología de Kharagpur. Nikhil es un entusiasta de la IA/ML que siempre está investigando aplicaciones en campos como los biomateriales y la ciencia biomédica. Con una sólida formación en ciencia de materiales, está explorando nuevos avances y creando oportunidades para contribuir.