Sentient AI lanza ROMA: un marco de metaagente de código abierto y centrado en AGI para crear agentes de IA con ejecución jerárquica de tareas

Sentient AI ha lanzado ROMA (Recursive Open Meta-Agent), un marco de meta-agente de código abierto para crear sistemas multiagente de alto rendimiento. ROMA estructura los flujos de trabajo agentes como un árbol de tareas jerárquico y recursivo: los nodos principales dividen un objetivo complejo en subtareas, las pasan a los nodos secundarios como contexto y luego agregan sus soluciones a medida que los resultados regresan, lo que hace que el contexto fluya de manera transparente y completamente rastreable a través de las transiciones de los nodos.

Arquitectura: Atomizar → Planificar → Ejecutar → Agregar

ROMA define un bucle de control recursivo mínimo. Un nodo primero atomiza una solicitud (atómica o no). Si no es atómico, un planificador lo descompone en subtareas; de lo contrario, un ejecutor ejecuta la tarea a través de un LLM, una herramienta/API o incluso un agente anidado. Luego, un agregador fusiona las salidas secundarias con la respuesta del padre. Este ciclo de decisión se repite para cada subtarea, lo que produce un árbol consciente de la dependencia que ejecuta ramas independientes en paralelo y aplica el orden de izquierda a derecha cuando una subtarea depende de una hermana anterior.

https://blog.sentient.xyz/posts/recursive-open-meta-agent

La información se mueve de arriba hacia abajo a medida que se desglosan las tareas y de abajo hacia arriba a medida que se agregan los resultados. ROMA también permite puntos de control humanos en cualquier nodo (por ejemplo, para confirmar un plan o verificar datos de un salto crítico) y muestra el seguimiento de etapas (entradas/salidas por nodo) para que los desarrolladores puedan depurar y perfeccionar indicaciones, herramientas y políticas de enrutamiento con visibilidad de cada transición. Esto aborda la brecha de observabilidad común en los marcos de agentes.

Superficie y pila del desarrollador

ROMA proporciona un inicio rápido de setup.sh con la configuración de Docker (recomendada) o la configuración nativa, además de indicadores para la integración de sandbox E2B (–e2b, –test-e2b). La pila enumera Backend: Python 3.12+ con FastAPI/Flask, Frontend: React + TypeScript con WebSocket en tiempo real, Soporte LLM: cualquier proveedor a través de LiteLLM y Ejecución de código: entornos aislados E2B. Las rutas de datos admiten el montaje empresarial de S3 con goofys FUSE, verificaciones de inyección de rutas y manejo seguro de credenciales de AWS, lo que mantiene las habilidades de hoja intercambiables mientras la metaarquitectura administra el gráfico de tareas y las dependencias.

En desarrollo, puede conectar ROMA a LLM cerrados o abiertos, modelos locales, herramientas deterministas u otros agentes sin tocar la metacapa; Las entradas/salidas se definen con Pydantic para E/S estructuradas y auditables durante las ejecuciones y el seguimiento.

¿Por qué es importante la recursividad?

Las estructuras ROMA funcionan como un árbol de tareas jerárquico y recursivo: los nodos principales dividen un objetivo complejo en subtareas, las transmiten como contexto y luego agregan soluciones secundarias a medida que los resultados regresan. Este desglose recursivo limita el contexto a lo que requiere cada nodo, lo que frena la expansión rápida, mientras que el seguimiento a nivel de etapa (con E/S estructurada de Pydantic) hace que el flujo sea transparente y totalmente rastreable, por lo que las fallas son diagnosticables en lugar de ser una caja negra. Los hermanos independientes pueden ejecutarse en paralelo y los bordes de dependencia imponen la secuenciación, convirtiendo las opciones de modelo/indicador/herramienta en componentes controlados y observables dentro del ciclo plan-ejecutar-agregar.

Para validar la arquitectura, Sentient creó ROMA Search, un agente de búsqueda en Internet implementado en la plataforma ROMA (no se afirma ninguna heurística de “investigación profunda” específica del dominio). En SEALQA (Seal-0), un subconjunto diseñado para enfatizar el razonamiento de múltiples fuentes, ROMA Search tiene una precisión del 45,6 %, superando a Kimi Researcher (36 %) y Gemini 2.5 Pro (19,8 %). ROMA también informa lo último en FRAMES (razonamiento de múltiples pasos) y casi SOTA en SimpleQA (recuperación de hechos). Al igual que con todos los resultados publicados por proveedores, trátelos como direccionales hasta que se reproduzcan de forma independiente, pero muestran que la arquitectura es competitiva en tareas centradas en hechos y con mucho razonamiento.

https://blog.sentient.xyz/posts/recursive-open-meta-agent
https://blog.sentient.xyz/posts/recursive-open-meta-agent
https://blog.sentient.xyz/posts/recursive-open-meta-agent

Para contexto adicional sobre SEALQA, el punto de referencia apunta al razonamiento de búsqueda aumentada donde los resultados web pueden ser conflictivos o ruidosos. Seal-0 se centra en cuestiones que desafían los sistemas actuales, alineándose con el énfasis de ROMA en pasos sólidos de descomposición y verificación.

¿Dónde encaja ROMA?

ROMA se posiciona como la columna vertebral de los metaagentes de código abierto: proporciona un árbol de tareas jerárquico y recursivo en el que los nodos principales descomponen los objetivos en subtareas, pasan contexto a los nodos secundarios (agentes/herramientas) y luego agregan resultados a medida que fluyen hacia arriba. El diseño enfatiza la transparencia a través del seguimiento de etapas y admite puntos de control humanos en el circuito, mientras que sus nodos modulares permiten a los constructores conectar cualquier modelo, herramienta o agente y explotar la paralelización para ramas independientes. Esto hace que las cargas de trabajo de varios pasos, que van desde el análisis financiero hasta la generación creativa, sean más fáciles de diseñar con un flujo de contexto explícito y una ejecución observable.

ROMA no es otro “envoltorio de agente”, pero parece un andamio recursivo disciplinado: Atomizador → Planificador → Ejecutor → Agregador, rastreado en cada salto, paralelo cuando sea seguro, secuencial cuando sea necesario. Los primeros resultados de ROMA Search son prometedores y se alinean con los objetivos del marco, pero el resultado más importante es el control del desarrollador (gráficos de tareas claros, interfaces escritas y flujo de contexto transparente) para que los equipos puedan iterar rápidamente y verificar cada etapa. Con una licencia Apache-2.0 y una implementación que ya incluye herramientas FastAPI/React, integración LiteLLM y rutas de ejecución en espacio aislado, ROMA es una base práctica para construir sistemas de agentes a largo plazo con un comportamiento medible e inspeccionable.

Consulte los códigos y los detalles técnicos. No dude en consultar nuestra página de GitHub para obtener tutoriales, códigos y cuadernos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.

🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.