Durante el año pasado, los desarrolladores de IA se han basado en el patrón ReAct (Razonamiento + Actuación), un ciclo simple en el que un LLM piensa, elige una herramienta y la ejecuta. Pero como sabe cualquier ingeniero de software que haya intentado llevar estos agentes a producción, los bucles simples son frágiles. Alucinan, pierden la noción de objetivos complejos y luchan con el “ruido de las herramientas” cuando se enfrentan a demasiadas API.
El equipo de Composio está cambiando los objetivos mediante el Agent Orchestrator de código abierto. Este marco está diseñado para hacer la transición de la industria de ‘Agentic Loops’ a ‘Agentic Workflows’: sistemas estructurados, con estado y verificables que tratan a los agentes de IA más como módulos de software confiables y menos como chatbots impredecibles.
La arquitectura: planificador versus ejecutor
La filosofía central detrás de Agent Orchestrator es la estricta separación de preocupaciones. En las configuraciones tradicionales, se espera que el LLM planifique la estrategia y ejecute los detalles técnicos simultáneamente. Esto a menudo conduce a una toma de decisiones “codiciosa” en la que el modelo se salta pasos cruciales.
Orchestrator de Composio presenta una arquitectura de doble capa:
El Planificador: esta capa es responsable de la descomposición de las tareas. Requiere un objetivo de alto nivel, como “Encontrar todos los problemas de alta prioridad de GitHub y resumirlos en una página de Notion”, y lo divide en una secuencia de subtareas verificables. El Ejecutor: Esta capa maneja la interacción real con las herramientas. Al aislar la ejecución, el sistema puede utilizar indicaciones especializadas o incluso diferentes modelos para el trabajo pesado de la interacción API sin saturar la lógica de planificación global.
Resolviendo el problema del ‘ruido de la herramienta’
El cuello de botella más importante en el desempeño de los agentes suele ser la ventana de contexto. Si le da a un agente acceso a 100 herramientas, la documentación de esas herramientas consume miles de tokens, confundiendo el modelo y aumentando la probabilidad de parámetros alucinados.
Agent Orchestrator resuelve esto a través de conjuntos de herramientas administrados. En lugar de exponer todas las capacidades a la vez, Orchestrator enruta dinámicamente solo las definiciones de herramientas necesarias al agente en función del paso actual del flujo de trabajo. Esta gestión de contexto “justo a tiempo” garantiza que el LLM mantenga una alta relación señal-ruido, lo que conduce a tasas de éxito significativamente más altas en la llamada de funciones.
Gestión del Estado y Observabilidad
Uno de los aspectos más frustrantes de la ingeniería de IA de nivel inicial es la naturaleza de “caja negra” de los agentes. Cuando un agente falla, a menudo es difícil saber si el error se debió a un mal plan, una llamada API fallida o una pérdida de contexto.
Agent Orchestrator presenta la orquestación con estado. A diferencia de los bucles sin estado que efectivamente “comienzan de nuevo” o dependen de historiales de chat desordenados para cada iteración, Orchestrator mantiene una máquina de estado estructurada.
Resiliencia: si falla una llamada a una herramienta (por ejemplo, un error 500 de una API de terceros), Orchestrator puede activar una rama de manejo de errores específica sin bloquear todo el flujo de trabajo. Trazabilidad: Se registra cada punto de decisión, desde el plan inicial hasta la ejecución final. Esto proporciona el nivel de observabilidad necesario para depurar software de nivel de producción.
Conclusiones clave
Desacoplar la planificación de la ejecución: el marco se aleja de los simples bucles de ‘Razón + Actuación’ al separar el Planificador (que descompone los objetivos en subtareas) del Ejecutor (que maneja las llamadas API). Esto reduce la toma de decisiones “codiciosa” y mejora la precisión de las tareas. Enrutamiento dinámico de herramientas (gestión de contexto): para evitar el “ruido” y las alucinaciones de LLM, Orchestrator solo proporciona definiciones de herramientas relevantes al modelo para la tarea actual. Esta gestión de contexto ‘Justo a tiempo’ garantiza altas relaciones señal-ruido incluso cuando se gestionan más de 100 API. Orquestación con estado centralizada: a diferencia de los agentes sin estado que dependen de un historial de chat no estructurado, Orchestrator mantiene una máquina de estado estructurada. Esto permite capacidades de “reanudación en caso de falla” y proporciona un seguimiento de auditoría claro para depurar la IA de nivel de producción. Recuperación de errores y resiliencia integradas: el marco introduce ‘bucles de corrección’ estructurados. Si una llamada a una herramienta falla o devuelve un error (como 404 o 500), Orchestrator puede activar una lógica de recuperación específica sin perder todo el progreso de la misión.
Consulte el repositorio de GitHub y los detalles técnicos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.