Crear agentes de IA es la nueva fiebre del oro. Pero todo desarrollador conoce el mayor obstáculo: lograr que la IA realmente se comunique con sus datos. Hoy en día, el gigante de los viajes Agoda está abordando este problema de frente. Han lanzado oficialmente APIAgent, una herramienta de código abierto diseñada para convertir cualquier API REST o GraphQL en un servidor Model Context Protocol (MCP) con 0 código y 0 implementaciones.
El problema: el ‘impuesto de integración’
Hasta hace poco, si quería que su agente de inteligencia artificial verificara los precios de los vuelos o buscara una base de datos, tenía que escribir una herramienta personalizada. Cuando Anthropic lanzó el Protocolo de contexto de modelo (MCP), creó una forma estándar para que los modelos de lenguaje grande (LLM) se conecten a herramientas externas.
Sin embargo, incluso con MCP, el flujo de trabajo es tedioso. Un desarrollador debe:
Escriba un nuevo servidor MCP en Python o TypeScript. Defina cada herramienta y sus parámetros manualmente. Implementar y mantener ese servidor. Actualice el código cada vez que cambie la API subyacente.
El equipo de Agoda lo llama el “impuesto de integración”. Para una empresa con miles de API internas, escribir miles de servidores MCP no es realista. APIAgent es su respuesta a este problema de escala.
¿Qué es APIAgent?
APIAgent es un servidor MCP universal. En lugar de escribir una lógica personalizada para cada API, utiliza APIAgent como proxy. Se encuentra entre su LLM (como Claude o GPT-4) y sus API existentes.
La herramienta se basa en una pila técnica específica:
FastMCP: alimenta la capa del servidor MCP. SDK de agentes OpenAI: maneja la orquestación del modelo de lenguaje. DuckDB: un motor SQL en proceso utilizado para el posprocesamiento de SQL.
La “magia” radica en su capacidad para comprender la documentación de la API. Usted proporciona una definición de su API (utilizando una especificación OpenAPI para REST o un esquema para GraphQL) y APIAgent se encarga del resto.
¿Cómo funciona?
La arquitectura es sencilla. APIAgent actúa como puerta de enlace. Cuando un usuario le hace una pregunta a un agente de IA, el flujo se ve así:
La solicitud: el usuario pregunta: “Muéstrame los 10 mejores hoteles de Bangkok con más opiniones”. Introspección de esquema: APIAgent inspecciona automáticamente el esquema de API para comprender los puntos finales y los campos disponibles. La capa SQL (DuckDB): esta es la salsa secreta. Si la API devuelve 10,000 filas sin ordenar, APIAgent usa DuckDB para filtrar, ordenar y agregar esos datos localmente a través de SQL antes de enviar el resultado conciso al LLM. La respuesta: Los datos JSON regresan a través de APIAgent, que los formatea para que la IA los lea.
Este sistema utiliza el descubrimiento dinámico de herramientas. Puede apuntar APIAgent a cualquier URL y genera automáticamente las herramientas necesarias para el LLM sin mapeo manual.
Característica clave: aprendizaje de ‘recetas’
Una de las características clave es el aprendizaje de recetas. Cuando una consulta compleja en lenguaje natural se ejecuta correctamente, APIAgent puede extraer el seguimiento y guardarlo como una ‘Receta’.
Estas recetas son plantillas parametrizadas. La próxima vez que se haga una pregunta similar, APIAgent utilizará la receta directamente. Esto omite el costoso paso de razonamiento del LLM, lo que reduce significativamente la latencia y el costo.
Conclusión clave
Puente de protocolo universal: APIAgent actúa como un único proxy de código abierto que convierte cualquier API REST o GraphQL en un servidor Model Context Protocol (MCP). Esto elimina la necesidad de escribir código repetitivo personalizado o mantener servidores MCP individuales para cada microservicio interno. Introspección de esquemas de código cero: la herramienta es “primero la configuración”. Simplemente apuntando APIAgent a una especificación de OpenAPI o un punto final GraphQL, automáticamente realiza una introspección del esquema para comprender los puntos finales y los campos. Luego los expone al LLM como herramientas funcionales sin mapeo manual. Postprocesamiento SQL avanzado: integra DuckDB, un motor SQL en proceso, para manejar la manipulación de datos complejos. Si una API devuelve miles de filas sin ordenar o carece de un filtrado específico, APIAgent utiliza SQL para ordenar, agregar o unir los datos localmente antes de entregar una respuesta concisa a la IA. Rendimiento a través de ‘Aprendizaje de recetas’: para resolver la alta latencia y los costos de LLM, el agente presenta el Aprendizaje de recetas. Registra el seguimiento de ejecución exitosa de una consulta en lenguaje natural y lo guarda como una plantilla parametrizada. Arquitectura de seguridad primero: el sistema es “seguro de forma predeterminada” y funciona en un estado de solo lectura. El proxy bloquea estrictamente cualquier acción ‘mutante’ (como solicitudes POST, PUT o DELETE) a menos que un desarrollador las incluya explícitamente en la lista blanca en el archivo de configuración YAML.
Consulte las relaciones públicas aquí. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.