Desde la automatización de backend hasta la colaboración frontend: lo nuevo en la última actualización de AG-UI para la interacción de AI Agent-User User

Introducción

Los agentes de IA se están moviendo cada vez más de los automatores de backend puro a elementos colaborativos visibles dentro de las aplicaciones modernas. Sin embargo, hacer que los agentes realmente interactuaran, con la capacidad de responder tanto a los usuarios como a guiar los flujos de trabajo proactivos, ha sido durante mucho tiempo un dolor de cabeza de ingeniería. Cada equipo termina construyendo canales de comunicación personalizados, manejo de eventos y gestión estatal, todo para necesidades de interacción similares.

El Liberación inicial de Ag -uianunciado en mayo de 2025, sirvió como un protocolo práctico de prueba de concepto de origen abierto para la comunicación en línea del usuario-usuario. Introdujo una arquitectura de un solo flujo, típicamente una publicación HTTP emparejada con eventos orientados al servidor (SSE), y estableció un vocabulario de eventos JSON estructurados (por ejemplo, text_message_content, tool_call_start, state_delta)) podría impulsar los componentes interactivos frontales. La primera versión abordó los desafíos de integración central (transmisión de tiempo real, orquestación de herramientas, estado compartido y manejo de eventos estandarizados), pero los usuarios encontraron que se necesitaba una formalización de eventos, versiones y soporte marco para un uso de producción más amplio.

AG -UI Última actualización propone un enfoque diferente. En lugar de otro kit de herramientas, ofrece un protocolo liviano que estandariza la conversación entre agentes e interfaces de usuario. Esta nueva versión acerca el protocolo a la calidad de la producción, mejora la claridad del evento y amplía la compatibilidad con los marcos y clientes de los agentes del mundo real.

Lo que distingue a la última actualización de Ag-Ui

La última actualización de AG-UI es un paso incremental pero significativo para aplicaciones impulsadas por el agente. A diferencia de los intentos de interactividad ad-hoc anteriores, la última actualización de Ag-UI se basa en eventos explícitos y versados. El protocolo no está bien acoplado a ninguna pila en particular; Está diseñado para funcionar con múltiples backends de agentes y tipos de clientes fuera de la caja.

Características clave en la última actualización de Ag-ui incluir:

  • Un conjunto formal de ~ 16 tipos de eventos, que cubre el ciclo de vida completo de un agente: salidas extendidas, invocaciones de herramientas, actualizaciones de estado, indicaciones del usuario y manejo de errores.
  • Esquemas de eventos más limpios, permitiendo a los clientes y agentes negociar capacidades y sincronizar el estado de manera más confiable.
  • Soporte más robusto tanto para la integración directa (nativa) como para el envoltorio basado en el adaptador de los agentes heredados.
  • Documentación ampliada y SDK que hacen que el protocolo sea práctico para el uso de producción, no solo la experimentación.

Los agentes interactivos requieren consistencia

Muchos agentes de IA hoy permanecen ocultos en el backend, diseñados para manejar las solicitudes y devolver los resultados, con poca consideración por la interacción del usuario en tiempo real. Hacer que los agentes interactuaran significa resolver varios desafíos técnicos:

  • Transmisión: Los agentes deben enviar resultados o mensajes incrementales tan pronto como estén disponibles, no solo al final de un proceso.
  • Estado compartido: Tanto el agente como la interfaz de usuario deben permanecer sincronizados, lo que refleja los cambios a medida que avanza la tarea.
  • Llamadas de herramientas: Los agentes deben poder solicitar herramientas externas (como API o acciones del usuario) y obtener los resultados de manera estructurada.
  • Mensajería bidireccional: Los usuarios deben poder responder o guiar al agente, no solo observar pasivamente.
  • Seguridad y control: Invocación de herramientas, cancelaciones y señales de error debe ser explícita y administrada de manera segura.

Sin un protocolo compartido, cada desarrollador termina reinventando estas ruedas, a menudo imperfectamente.

Cómo la última actualización de Ag-ui Obras

La última actualización de AG-UI formaliza la interacción del usuario del agente como un flujo de eventos mecanografiados. Los agentes emiten estos eventos mientras operan; Los clientes se suscriben a la transmisión, interpretan los eventos y envían respuestas cuando sea necesario.

La transmisión del evento

El núcleo de la última actualización de Ag-ui es su taxonomía de eventos. Hay ~ 16 tipos de eventos, que incluyen:

  • mensaje: Salida del agente, como una actualización de estado o una parte del texto generado.
  • function_call: Agent le pide al cliente que ejecute una función o herramienta, que a menudo requiere un recurso externo o acción del usuario.
  • state_update: Sincroniza variables o información de progreso.
  • Input_Request: Solicita al usuario un valor o elección.
  • Tool_Result: Envía resultados de las herramientas al agente.
  • error y control: Errores de señal, cancelaciones o finalización.

Todos los eventos están codificados por JSON, escrito y versados. Esta estructura hace que sea sencillo analizar los eventos, manejar errores con gracia y agregar nuevas capacidades con el tiempo.

Integrando agentes y clientes

Hay dos patrones principales para la integración:

  • Nativo: Los agentes se construyen o modifican para emitir eventos AG-UI directamente durante la ejecución.
  • Adaptador: Para los agentes heredados o de terceros, un módulo adaptador puede interceptar salidas y traducirlas en eventos AG-UI.

En el lado del cliente, las aplicaciones abren una conexión persistente (generalmente a través de SSE o WebSocket), escuchan eventos y actualizan su interfaz o envían respuestas estructuradas según sea necesario.

El protocolo es intencionalmente agnóstico del transporte, pero apoya la transmisión en tiempo real para la capacidad de respuesta.

Adopción y ecosistema

Desde su lanzamiento inicial, Ag-ui ha visto la adopción entre los marcos de orquestación de agentes populares. AG -UI Última versiónEl esquema de eventos ampliado y la documentación mejorada han acelerado los esfuerzos de integración.

Las integraciones actuales o en progreso incluyen:

  • Langchain, Crewai, Mastra, AG2, Agno, Llamaindex: Cada uno ofrece orquestación para agentes que ahora pueden superficialmente surgen su estado interno y progreso.
  • AWS, A2A, ADK, Agenteps: El trabajo está en curso para Bridge Cloud, Monitoring y Herramientas de operación de agentes con AG-UI.
  • Capa humana (integración floja): Demuestra cómo los agentes pueden convertirse en miembros del equipo de colaboración en entornos de mensajería.

El protocolo ha ganado tracción con los desarrolladores que buscan evitar construir manipuladores de enchufes personalizados y esquemas de eventos para cada proyecto. Actualmente tiene más de 3.500 estrellas de Github y se está utilizando en un número creciente de productos impulsados ​​por agentes.

Experiencia del desarrollador

La última actualización de AG-UI está diseñada para minimizar la fricción tanto para los constructores de agentes como para los ingenieros frontend.

  • SDKS y plantillas: La herramienta CLI NPX Create-AG-UI-APP anda un proyecto con todas las dependencias e integraciones de muestra incluidas.
  • Esquemas claros: Los eventos son versionados y documentados, lo que admite un manejo de errores sólido y una extensibilidad futura.
  • Documentación práctica: Guías de integración del mundo real, flujos de ejemplo y activos visuales ayudan a reducir la prueba y el error.

Todos los recursos y guías están disponibles en Ag-ui.com.

Casos de uso

  • Copilotos incrustados: Agentes que trabajan junto con los usuarios en aplicaciones existentes, proporcionando sugerencias y explicaciones a medida que evolucionan las tareas.
  • UI conversacional: Sistemas de diálogo que mantienen el estado de sesión y admiten interacciones múltiples con el uso de herramientas.
  • Automatización de flujo de trabajo: Agentes que orquestan secuencias que involucran tanto acciones automatizadas como pasos humanos en el circuito.

Conclusión

El Última actualización de AG-UI Proporciona un protocolo bien definido y liviano para construir aplicaciones basadas en agentes interactivos. Su arquitectura basada en eventos abstrae gran parte de la complejidad de la sincronización de los usuarios de agentes, la comunicación en tiempo real y la gestión estatal. Con esquemas explícitos, soporte de marco amplio y un enfoque en la integración práctica, la última actualización de AG-UI permite a los equipos de desarrollo construir sistemas de IA más confiables e interactivos, sin resolver repetidamente los mismos problemas de bajo nivel.

Los desarrolladores interesados ​​en adoptar la última actualización de AG-UI pueden encontrar SDK, documentación técnica y activos de integración en Ag-ui.com.

Copilotkit Team también está organizando un Seminario web.

Apoyar la fuente abierta y estrella el Repo de Github de AG-UI.

Discord Community: https://go.copilotkit.ai/ag-ui-discord


Gracias a la Copilotkit equipo para el liderazgo/ recursos de pensamiento para este artículo. Copilotkit El equipo nos ha apoyado en este contenido/artículo.


Asif Razzaq es el CEO de MarktechPost Media Inc .. Como empresario e ingeniero visionario, ASIF se compromete a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, MarktechPost, que se destaca por su cobertura profunda de noticias de aprendizaje automático y de aprendizaje profundo que es técnicamente sólido y fácilmente comprensible por una audiencia amplia. La plataforma cuenta con más de 2 millones de vistas mensuales, ilustrando su popularidad entre el público.