Los agentes que utilizan el MCP del protocolo de contexto modelo tienen un problema de escala. Cada definición de herramienta y cada resultado intermedio se envía a través de la ventana contextual, lo que significa que los grandes flujos de trabajo queman tokens y alcanzan rápidamente los límites de latencia y costos. El nuevo patrón de ‘ejecución de código con MCP’ de Anthropic reestructura esta canalización al convertir las herramientas MCP en API a nivel de código y pedirle al modelo que escriba y ejecute código en lugar de llamar a las herramientas directamente.
El problema, las herramientas MCP como llamadas directas al modelo
MCP es un estándar abierto que permite que las aplicaciones de IA se conecten a sistemas externos a través de servidores MCP que exponen herramientas. Estas herramientas permiten que un modelo consulte bases de datos, llame a API o trabaje con archivos a través de una interfaz unificada.
En el patrón predeterminado, un agente carga muchas definiciones de herramientas en el contexto del modelo. Cada definición de herramienta contiene información de esquema y metadatos. Los resultados intermedios de cada llamada a la herramienta también se transmiten al contexto para que el modelo pueda decidir la siguiente llamada.
Anthropic describe un caso típico en el que un agente utiliza un servidor MCP para Google Drive para obtener una transcripción larga de una reunión de ventas y luego utiliza otro servidor MCP para Salesforce para actualizar un registro con esa transcripción. La transcripción completa primero se devuelve a través del modelo y luego se envía nuevamente cuando se llama a la herramienta Salesforce. Para una reunión larga, esto puede agregar decenas de miles de tokens adicionales que no cambian la lógica de la tarea.
Cuando hay muchos servidores MCP y muchas herramientas, este patrón no se escala. El modelo vale la pena leer grandes catálogos de herramientas y mover grandes cargas útiles entre herramientas. La latencia aumenta, los costos aumentan y los límites del contexto se convierten en un límite estricto para el comportamiento del sistema.
El cambio representa los servidores MCP como API de código.
La propuesta de Anthropic es colocar MCP dentro de un bucle de ejecución de código. En lugar de permitir que el modelo llame a las herramientas directamente, el cliente MCP expone cada servidor como un conjunto de módulos de código en un sistema de archivos. El modelo escribe código TypeScript que importa y compone esos módulos, y este código se ejecuta en un entorno de espacio aislado.
El patrón tiene tres pasos principales.
El cliente MCP genera un directorio, como servidores, que refleja los servidores y herramientas MCP disponibles. Para cada herramienta MCP, crea una función contenedora delgada implementada en un archivo fuente, por ejemplo servers/google-drive/getDocument.ts, que llama internamente a la herramienta MCP con parámetros escritos. Se le indica al modelo que escriba código TypeScript que importe estas funciones, las ejecute y maneje el flujo de control y el movimiento de datos dentro del entorno de ejecución.
El flujo de trabajo anterior de Google Drive y Salesforce se convierte en un breve guión. El script llama al contenedor de Google Drive una vez, manipula o inspecciona los datos localmente y luego llama al contenedor de Salesforce. La transcripción grande no pasa por el modelo, sólo el estado final y cualquier pequeña muestra o resumen.
El trabajo ‘Code Mode’ de Cloudflare utiliza la misma idea en su plataforma Workers. Convierte herramientas MCP en API de TypeScript y ejecuta código generado por modelos dentro de un aislamiento con enlaces restringidos.
Impacto cuantitativo, el uso de tokens cae un 98,7 por ciento
Anthropic informa un ejemplo concreto. Un flujo de trabajo que anteriormente consumía alrededor de 150.000 tokens cuando las herramientas y los datos intermedios pasaban directamente a través del modelo se reimplementó con ejecución de código y API MCP basadas en sistemas de archivos. El nuevo patrón utilizó alrededor de 2000 tokens. Esa es una reducción del 98,7 por ciento en el uso de tokens para ese escenario, lo que también reduce el costo y la latencia.
Beneficios de diseño para creadores de agentes
La ejecución de código con MCP presenta varios beneficios prácticos para los ingenieros que diseñan agentes:
Descubrimiento progresivo de herramientas: el agente no necesita todas las definiciones de herramientas en contexto. Puede explorar el sistema de archivos generado, enumerar los servidores disponibles y leer módulos de herramientas específicos solo cuando sea necesario. Esto traslada los catálogos de herramientas del contexto del modelo al código, por lo que los tokens se gastan solo en interfaces relevantes.
Manejo de datos contextualmente eficiente: grandes conjuntos de datos permanecen dentro del entorno de ejecución. Por ejemplo, el código TypeScript puede leer una hoja de cálculo grande a través de una herramienta MCP, filtrar filas, calcular agregados y registrar solo muestras pequeñas y estadísticas resumidas en el modelo. El modelo ve una vista compacta de los datos mientras que el trabajo pesado se realiza en el código.
Operaciones de preservación de la privacidad: Anthropic describe un patrón en el que los campos confidenciales, como el correo electrónico o el teléfono, se tokenizan dentro del entorno de ejecución. El modelo ve marcadores de posición, mientras que el cliente MCP mantiene un mapeo seguro y restaura valores reales al llamar a herramientas posteriores. Esto permite que los datos se muevan entre servidores MCP sin exponer identificadores sin formato al modelo.
Habilidades estatales y reutilizables: el sistema de archivos permite a los agentes almacenar archivos intermedios y scripts reutilizables. Un script auxiliar que transforma una hoja en un informe se puede guardar en un directorio de habilidades e importar en sesiones posteriores. Anthropic conecta esta idea con Claude Skills, donde colecciones de scripts y metadatos definen capacidades de nivel superior.
El enfoque de ‘ejecución de código con MCP’ de Anthropic es un siguiente paso sensato para los agentes impulsados por MCP. Ataca directamente los costos simbólicos de cargar definiciones de herramientas y enrutar grandes resultados intermedios a través del contexto, al presentar servidores MCP como API de código y llevar el trabajo a un tiempo de ejecución de TypeScript en espacio aislado. Esto hace que los agentes sean más eficientes y, al mismo tiempo, obliga a los equipos a tomarse en serio la seguridad de la ejecución del código. Este lanzamiento convierte a MCP de una lista de herramientas a una superficie API ejecutable.
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.
🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.