Agent-Infra lanza AIO Sandbox: un tiempo de ejecución todo en uno para agentes de IA con navegador, Shell, sistema de archivos compartido y MCP

En el desarrollo de agentes autónomos, el cuello de botella técnico está pasando del razonamiento del modelo al entorno de ejecución. Si bien los modelos de lenguajes grandes (LLM) pueden generar código y planes de varios pasos, proporcionar un entorno funcional y aislado para que se ejecute ese código sigue siendo un desafío de infraestructura importante.

Sandbox de Agent-Infra, un proyecto de código abierto, aborda esto proporcionando una capa de ejecución ‘todo en uno’ (AIO). A diferencia de la contenedorización estándar, que a menudo requiere una configuración manual para el encadenamiento de herramientas, AIO Sandbox integra un navegador, un shell y un sistema de archivos en un único entorno diseñado para agentes de IA.

La arquitectura todo en uno

El principal obstáculo arquitectónico en el desarrollo de agentes es la fragmentación de herramientas. Normalmente, un agente puede necesitar un navegador para recuperar datos, un intérprete de Python para analizarlos y un sistema de archivos para almacenar los resultados. Administrarlos como servicios separados introduce latencia y complejidad de sincronización.

Agent-Infra consolida estos requisitos en un único entorno en contenedores. La caja de arena incluye:

Interacción con la computadora: un navegador Chromium controlable a través del protocolo Chrome DevTools (CDP), con soporte documentado para Playwright. Ejecución de código: tiempos de ejecución preconfigurados para Python y Node.js. Herramientas estándar: una terminal bash y un sistema de archivos accesible a través de módulos. Interfaces de desarrollo: instancias integradas de VSCode Server y Jupyter Notebook para monitoreo y depuración.

https://github.com/agent-infra/sandbox?tab=readme-ov-file

El sistema de archivos unificado

Una característica técnica central de Sandbox es su sistema de archivos unificado. En un flujo de trabajo de agente estándar, un agente puede descargar un archivo mediante una herramienta basada en navegador. En una configuración fragmentada, ese archivo debe moverse mediante programación a un entorno separado para su procesamiento.

AIO Sandbox utiliza una capa de almacenamiento compartido. Esto significa que un archivo descargado a través del navegador Chromium es inmediatamente visible para el intérprete de Python y el shell Bash. Este estado compartido permite transiciones entre tareas, como que un agente descargue un CSV de un portal web y ejecute inmediatamente un script de limpieza de datos en Python, sin manejo de datos externos.

Integración del protocolo de contexto modelo (MCP)

Sandbox incluye soporte nativo para Model Context Protocol (MCP), un estándar abierto que facilita la comunicación entre modelos y herramientas de IA. Al proporcionar servidores MCP preconfigurados, Agent-Infra permite a los desarrolladores exponer capacidades de espacio aislado a los LLM a través de un protocolo estandarizado.

Los servidores MCP disponibles incluyen:

Navegador: Para navegación web y extracción de datos. Archivo: para operaciones en el sistema de archivos unificado. Shell: Para ejecutar comandos del sistema. Markitdown: para convertir formatos de documentos a Markdown para optimizarlos para el consumo de LLM.

Aislamiento e implementación

Sandbox está diseñado para la “implementación de Docker de nivel empresarial”, centrándose en el aislamiento y la escalabilidad. Si bien proporciona un entorno persistente para tareas complejas (como mantener una sesión de terminal durante varios turnos), está diseñado para ser lo suficientemente liviano para una implementación de alta densidad.

Despliegue y Control:

Infraestructura: el proyecto incluye ejemplos de implementación de Kubernetes (K8), lo que permite a los equipos aprovechar las características nativas de K8, como los límites de recursos (CPU y memoria) para administrar la huella del sandbox. Aislamiento de contenedores: al ejecutar actividades del agente dentro de un contenedor dedicado, el entorno de pruebas proporciona una capa de separación entre el código generado por el agente y el sistema host. Acceso: el entorno se gestiona a través de una API y un SDK, lo que permite a los desarrolladores activar comandos mediante programación, ejecutar código y gestionar el estado del entorno.

Comparación técnica: Docker tradicional frente a AIO Sandbox

CaracterísticaEnfoque tradicional de DockerEnfoque AIO Sandbox (Agent-Infra)ArquitecturaNormalmente multicontenedor (uno para navegador, uno para código, otro para shell).Contenedor unificado: navegador, Shell, Python e IDE (VSCode/Jupyter) en un tiempo de ejecución.Manejo de datosRequiere montajes de volumen o “plomería” API manual para mover archivos entre contenedores.Sistema de archivos unificado: los archivos se comparten de forma nativa. Las descargas del navegador son visibles instantáneamente para Shell/Python. Integración de agentes Requiere un “código adhesivo” personalizado para asignar acciones de LLM a comandos de contenedor. Compatibilidad nativa con MCP: servidores de protocolo de contexto de modelo preconfigurados para el descubrimiento de agentes estándar. Interfaz de usuario basada en CLI; Las interfaces de usuario web como VSCode o VNC requieren una importante configuración manual. Elementos visuales integrados: VNC integrado (para Chromium), VSCode Server y Jupyter listos para usar. Control de recursos Administrado a través de grupos de trabajo estándar Docker/K8 y límites de recursos. Depende del orquestador subyacente (K8s/Docker) para la limitación y los límites de recursos. Conectividad Redes de host/puente Docker estándar; se necesita configuración manual del proxy. Control de navegador basado en CDP: interacción de navegador especializada a través del protocolo Chrome DevTools. Los contenedores de persistencia suelen ser de larga duración o se restablecen manualmente; la gestión del estado es personalizada. Soporte de sesión con estado: admite terminales persistentes y el estado del espacio de trabajo durante el ciclo de vida de la tarea.

Escalar la pila de agentes

Si bien el Sandbox principal es de código abierto (Apache-2.0), la plataforma se posiciona como una solución escalable para equipos que crean flujos de trabajo agentes complejos. Al reducir la sobrecarga de ‘Operaciones del agente’ (el trabajo necesario para mantener los entornos de ejecución y manejar los conflictos de dependencia), el sandbox permite a los desarrolladores centrarse en la lógica del agente en lugar del tiempo de ejecución subyacente.

A medida que los agentes de IA pasan de simples chatbots a operadores capaces de interactuar con la web y los archivos locales, el entorno de ejecución se convierte en un componente crítico de la pila. El equipo de Agent-Infra está posicionando AIO Sandbox como un tiempo de ejecución liviano y estandarizado para esta transición.

Consulte el repositorio aquí. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 120.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.