Actualmente, la industria de la IA está obsesionada con los ‘agentes’: programas autónomos que hacen más que simplemente chatear. Sin embargo, la mayoría de los sistemas multiagente actuales se basan en heurísticas frágiles y codificadas que fallan cuando cambia el entorno.
Los investigadores de Google DeepMind han propuesto una nueva solución. El equipo de investigación argumentó que para que la “red agentica” crezca, los agentes deben ir más allá de la simple división de tareas y adoptar principios organizativos similares a los humanos, como la autoridad, la responsabilidad y la rendición de cuentas.
Definición de delegación ‘inteligente’
En el software estándar, una subrutina simplemente se “subcontrata”. La delegación inteligente es diferente. Es una secuencia de decisiones donde un delegado transfiere autoridad y responsabilidad a un delegado. Este proceso implica evaluación de riesgos, coincidencia de capacidades y establecimiento de confianza.
Los 5 pilares del marco
Para construir esto, el equipo de investigación identificó cinco requisitos básicos asignados a protocolos técnicos específicos:
Estrategia de ingeniería: descomposición del ‘contrato primero’
El cambio más significativo es la descomposición del contrato primero. Según este principio, un delegado sólo asigna una tarea si el resultado puede verificarse con precisión.
Si una tarea es demasiado subjetiva o compleja para verificarla (como “escribir un artículo de investigación convincente”), el sistema debe descomponerla recursivamente. Esto continúa hasta que las subtareas coincidan con las herramientas de verificación disponibles, como pruebas unitarias o pruebas matemáticas formales.
Verificación recursiva: la cadena de custodia
En una cadena de delegación, como 𝐴 → 𝐵 → 𝐶, la responsabilidad es transitiva.
El Agente B es responsable de verificar el trabajo de C. Cuando el Agente B devuelve el resultado a A, debe proporcionar una cadena completa de certificaciones firmadas criptográficamente. Luego, el agente A realiza una verificación de dos etapas: verificar el trabajo directo de B y verificar que B verificó correctamente a C.
Seguridad: tokens y túneles
Escalar estas cadenas introduce riesgos de seguridad masivos, incluida la filtración de datos, la implantación de puertas traseras y la extracción de modelos.
Para proteger la red, el equipo de DeepMind sugiere tokens de capacidad de delegación (DCT). Basados en tecnologías como Macaroons o Biscuits, estos tokens utilizan “advertencias criptográficas” para hacer cumplir el principio de privilegio mínimo. Por ejemplo, un agente podría recibir un token que le permita LEER una carpeta específica de Google Drive pero prohíba cualquier operación de ESCRITURA.
Evaluación de protocolos actuales
El equipo de investigación analizó si los estándares industriales actuales están preparados para este marco. Si bien estos protocolos proporcionan una base, a todos ellos les faltan “piezas” para la delegación de alto riesgo.
MCP (Protocolo de contexto de modelo): estandariza cómo los modelos se conectan a las herramientas. La brecha: Carece de una capa de políticas para regular los permisos en cadenas de delegación profundas. A2A (Agente a agente): gestiona el descubrimiento y los ciclos de vida de las tareas. The Gap: Carece de encabezados estandarizados para pruebas de conocimiento cero (ZKP) o cadenas de firmas digitales. AP2 (Protocolo de pagos de agentes): autoriza a los agentes a gastar fondos. The Gap: No puede verificar de forma nativa la calidad del trabajo antes de realizar el pago. UCP (Protocolo de Comercio Universal): Estandariza las transacciones comerciales. The Gap: está optimizado para compras/cumplimiento, no para tareas computacionales abstractas.
Conclusiones clave
Vaya más allá de la heurística: las delegaciones actuales de IA se basan en heurísticas simples y codificadas que son frágiles y no pueden adaptarse dinámicamente a cambios ambientales o fallas inesperadas. La delegación inteligente requiere un marco adaptativo que incorpore la transferencia de autoridad, responsabilidad y rendición de cuentas. Descomposición de tareas “primero el contrato”: para objetivos complejos, los delegados deben utilizar un enfoque de “primero el contrato”, donde las tareas se descomponen hasta que las subunidades coincidan con capacidades de verificación automatizadas específicas, como pruebas unitarias o pruebas formales. Responsabilidad transitiva en cadenas: en cadenas de delegación largas (p. ej., 𝐴 → 𝐵 → 𝐶), la responsabilidad es transitiva. El Agente B es responsable del trabajo de C, y el Agente A debe verificar tanto el trabajo directo de B como que B verificó correctamente las certificaciones de C. Seguridad atenuada mediante tokens: para evitar infracciones sistémicas y el “problema del diputado confuso”, los agentes deben utilizar tokens de capacidad de delegación (DCT) que proporcionan autorización atenuada. Esto garantiza que los agentes operen bajo el principio de privilegio mínimo, con acceso restringido a subconjuntos específicos de recursos y operaciones permitidas.
Consulte el documento aquí. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.