céntrese en tareas aisladas o en ingeniería rápida simple. Este enfoque nos permitió crear aplicaciones interesantes a partir de un único mensaje, pero estamos empezando a alcanzar un límite. Las indicaciones simples se quedan cortas cuando abordamos tareas complejas de IA que requieren múltiples etapas o sistemas empresariales que deben factorizar la información gradualmente. La carrera hacia AGI puede verse como una ampliación de los parámetros del modelo existente, acompañada de una arquitectura innovadora o una colaboración de múltiples modelos. Si bien la ampliación es costosa y se limita a las capacidades de los modelos existentes, y los avances son inmensurables y pueden ocurrir en cualquier momento, la orquestación de múltiples modelos sigue siendo la forma más cercana de construir sistemas inteligentes que puedan realizar tareas complejas como los humanos.
Una forma de inteligencia es la capacidad de los agentes de crear otros agentes con una mínima intervención, donde la IA tiene la libertad de actuar según se le solicite. En esta nueva fase, la inteligencia artificial se encarga de los complejos planos, mientras que el ser humano permanece al tanto para garantizar la seguridad.
Diseño para la integración de máquina a máquina
Necesitamos una forma estándar para que las máquinas se comuniquen entre sí sin que un ser humano escriba integraciones personalizadas para cada conexión. Aquí es donde el Protocolo de contexto modelo (MCP) se convierte en una parte importante de la pila. MCP sirve como una interfaz universal para que los modelos interactúen con entornos existentes, como llamar a herramientas, buscar API o consultar bases de datos. Si bien esto puede parecer autónomo, el ingeniero requiere una cantidad significativa de trabajo manual para definir el MCP para el modelo o agente.
Además, un marco topológico es esencial para guiar la lógica de las interacciones de los agentes como parte del viaje de autonomía. Dejar que los agentes trabajen en un mundo abierto y desordenado provoca alucinaciones y una sobrecarga del trabajo requerido. Sin embargo, tener un marco basado en gráficos puede organizar el flujo de ejecución. Si tratamos los modelos como nodos y sus interacciones como aristas, podemos empezar a visualizar las dependencias y el flujo de datos en todo el sistema. Podemos construir sobre el gráfico y el plano MCP para crear agentes planificadores que trabajen dentro del marco para generar planos para resolver problemas descomponiendo de forma autónoma objetivos complejos en secuencias de tareas procesables. El agente planificador identifica lo que se necesita, el marco basado en gráficos organiza las dependencias para evitar alucinaciones y genera agentes para lograr sus objetivos; llamémoslos “Agentes Vibe”.
Inteligencia con agentes de Vibe
A medida que pasamos de una teoría autónoma a un sistema de trabajo completo, necesitaremos una forma de convertir declaraciones de “vibración” de alto nivel en gráficos ejecutables. El usuario proporciona una intención y el sistema la convierte en un equipo de agentes que colaboran para lograr el resultado. A diferencia de muchos sistemas de múltiples agentes que se coordinan a través de una conversación de forma libre, los agentes de Vibe operan dentro de un gráfico explícito donde las dependencias y las rutas de ejecución están estructuradas y son observables. Este es el problema en el que he estado trabajando para resolver como mantenedor del marco de código abierto IntelliNode (licencia Apache). Está diseñado en torno a un agente planificador que genera el plano del gráfico a partir de la intención del usuario y luego lo ejecuta enrutando datos entre agentes y recopilando los resultados finales.
IntelliNode ofrece un hogar para los agentes de Vibe, permitiéndoles no existir estrictamente como scripts estáticos sino actuar como participantes fluidos dentro de un flujo de trabajo en evolución.
Los Vibe Agents creados dentro de IntelliNode representan nuestro primer intento experimental de crear una capa autónoma. En esencia, queremos crear un proceso mediante el cual la definición de cada tarea se realice mediante orquestación declarativa, la descripción del resultado deseado. Al emplear este marco, permitiremos a los usuarios crear indicaciones que permitan a los agentes orquestados realizar tareas excepcionalmente complejas en lugar de tareas simples y fragmentadas.
Caso de uso: la fábrica autónoma de investigación a contenido
En un flujo de trabajo tradicional, crear un informe detallado o un artículo técnico requiere un esfuerzo sustancial para compilar resultados de búsqueda, analizar datos y redactar borradores. Dentro de este marco, el cuello de botella en el flujo de trabajo es que cada acción realizada requiere aportaciones de otras capas.
Al implementar Vibe Agents, podremos establecer un canal autoorganizado que se centre en el uso de datos actuales en vivo. Cuando alguien solicita una intención de alto nivel, proporcionará la siguiente declaración única: “Investigue los últimos avances en baterías de estado sólido de los últimos 30 días y genere un resumen técnico con una descripción del diagrama de respaldo”.
Cómo ejecuta IntelliNode Framework “Vibe”
Cuando el arquitecto recibe esta intención, en lugar de simplemente producir código, genera un plano personalizado sobre la marcha:
El Scout (Agente de Búsqueda): utiliza google_api_key para realizar consultas en tiempo real en Internet. El analista (agente de texto): procesa los resultados de las consultas y extrae todas las especificaciones técnicas de los fragmentos sin procesar. El creador (agente de imágenes): produce el informe final, crea un diseño o proporciona una representación visual de los resultados.
En lugar de escribir código y crear una conexión API para ejecutar su intención, usted proporciona la intención a la máquina y esta crea el equipo especializado necesario para cumplir esa intención.
Implementación usando VibeFlow
El siguiente código demuestra cómo manejar la transición del lenguaje natural a una canalización de búsqueda y contenido completamente orquestada.
1. Configure su entorno
Configure sus claves API como variables de entorno para autenticar al arquitecto y a los agentes autónomos.
exportar OPENAI_API_KEY=”tu_clave_openai” exportar GOOGLE_API_KEY=”tu_clave_de_nube_google” exportar GOOGLE_CSE_ID=”tu_id_motor_de_búsqueda” exportar GEMINI_API_KEY=”tu_clave_gemini”
Instalar IntelliNode:
instalación de pip intelli -q
2. Inicializar el arquitecto
importar asyncio importar sistema operativo desde intelli.flow.vibe importar VibeFlow # Inicializar con el planificador y la configuración del modelo preferido vf = VibeFlow (planner_api_key=os.getenv(“OPENAI_API_KEY”), planificador_model=”gpt-5.2″, image_model=”gemini gemini-3-pro-image-preview” )
3. Definir la intención
Un “Vibe” es una declaración declarativa de alto nivel. El Arquitecto analizará esto y decidirá qué agentes especializados son necesarios para cumplir la misión.
intent = ( “Cree un flujo lineal de 3 pasos para una ‘Fábrica de investigación a contenido’: ” “1. Búsqueda: realice una investigación web utilizando SÓLO ‘google’ como proveedor de avances en baterías de estado sólido en los últimos 30 días. ” “2. Analista: resuma los hallazgos en métricas técnicas clave. ” “3. Creador: genere una imagen usando ‘gemini’ que muestre una representación futurista de estos hallazgos sobre baterías. ” ) # Construya el equipo y el flujo del plano visual = espere vf.build (intención)
4. Ejecutar la misión
La ejecución maneja la orquestación, el paso de datos entre agentes y el guardado automático de todas las imágenes y resúmenes generados.
# Configurar directorio de salida y guardado automático flow.output_dir = “./results” flow.auto_save_outputs = True # Ejecutar los resultados de fábrica autónomos = await flow.start() print(f”Resultados guardados en {flow.output_dir}”)
Los sistemas de agentes están pasando rápidamente de “trucos rápidos” a arquitecturas de software, y la pregunta clave ya no es si múltiples agentes pueden trabajar juntos, sino cómo se limita y replica esta cooperación en la producción. Muchos sistemas exitosos utilizan una coordinación de agentes similar a una conversación, lo cual es muy útil en la creación de prototipos, pero es difícil de razonar a medida que los flujos de trabajo se vuelven complejos. Otros adoptan un enfoque de flujo de trabajo más avanzado, como la ejecución basada en gráficos.
La idea detrás de Vibe Agents es compilar la intención del usuario en gráficos que puedan ejecutarse y rastrearse, de modo que la secuencia de principio a fin sea observable. Esto significa mucho menos costura a mano y más trabajo con el plano que genera este sistema.
Referencias
https://www.anthropic.com/news/model-context-protocol
https://docs.intellinode.ai/docs/python/vibe-agents