Cree sistemas multiagente LangGraph sin servidor altamente escalables en AWS con Amazon Bedrock AgentCore

La IA generativa ha evolucionado rápidamente desde prototipos experimentales hasta sistemas que se espera que funcionen de manera confiable en producción, a escala y bajo limitaciones de desempeño del mundo real. A medida que las organizaciones van más allá de las demostraciones y pruebas de concepto, se enfrentan cada vez más a desafíos relacionados con la latencia de inferencia, la escalabilidad, la gestión del estado y la visibilidad operativa. Hoy en día, crear agentes de IA de alto rendimiento requiere más que modelos potentes y exige una implementación que pueda ofrecer un rendimiento consistente, preservar el contexto en todas las interacciones y proporcionar una observabilidad profunda de cómo los agentes razonan y se comportan en producción.

En esta publicación, brindamos una solución para crear sistemas de IA generativa de múltiples agentes sin servidor y altamente escalables en AWS utilizando LangGraph Agents como orquestadores integrados con Amazon Bedrock AgentCore Memory y Amazon Bedrock AgentCore Observability.

Nuestro enfoque para crear orquestaciones multiagente sin servidor altamente escalables combina tecnologías sin servidor como AWS Lambda y AWS Step Functions. Los desarrolladores pueden utilizar estos servicios para crear agentes LangGraph que se escalen automáticamente, respondan a eventos en tiempo real y eliminen la administración de infraestructura. Esto los hace ideales para cargas de trabajo de agentes dinámicas y en ráfagas. Al combinar estos servicios, puede orquestar flujos de trabajo de agentes complejos con múltiples herramientas con administración de estado duradera, reintentos y control de costos detallado.

El modelo de ejecución explícito basado en gráficos de LangGraph permite la coordinación determinista, el paralelismo y el enrutamiento condicional entre agentes, lo que hace que los flujos de trabajo complejos de múltiples agentes sean más sencillos de razonar y depurar. Al separar la lógica de orquestación del comportamiento de los agentes, puede utilizar LangGraph para agregar, eliminar o desarrollar agentes especializados de forma independiente mientras mantiene una ruta de ejecución clara y auditable. Esto es especialmente valioso para los sistemas de producción que requieren comportamiento predecible, extensibilidad y control estructurado sobre el razonamiento de múltiples agentes.

AgentCore Observability amplía estas capacidades al proporcionar visibilidad detallada de cada invocación, capturando entradas/salidas del modelo, latencia y métricas de la cadena de herramientas en componentes distribuidos sin servidor. Los servicios de memoria integrados de AgentCore Memory permiten a los agentes mantener un contexto conversacional a corto plazo y conocimientos a largo plazo durante las sesiones.

Descripción general de la solución

Nuestra solución de sistema de orquestación de múltiples agentes basada en LangGraph y AgentCore sin servidor es un sistema generativo de revisión de campañas de múltiples agentes impulsado por IA que organiza revisiones humanas utilizando diversas personas que permiten que las campañas de marketing resuenen auténticamente con las audiencias objetivo mientras mantienen la alineación legal y los estándares de marca. Consta de tres agentes de inteligencia artificial especializados que analizan la campaña de marketing en paralelo: un agente revisor personal revisa el contenido desde diversas perspectivas demográficas y proporciona puntuación de resonancia, un agente validador verifica la alineación legal y el cumplimiento de las pautas de la marca, mientras que un agente finalizador sintetiza los comentarios en recomendaciones procesables. Los usuarios cargan documentos de campaña a través de una interfaz de React que también busca resultados y muestra reseñas a medida que están disponibles.

Usamos LangGraph para implementar el orquestador y los agentes especializados modelando el sistema como un gráfico de ejecución con estado. Cada nodo representa una función de agente discreta, específicamente revisión de personas, validación de cumplimiento y síntesis de retroalimentación, y los bordes definen el flujo de control entre estos pasos. El orquestador se implementa como el gráfico de supervisión que enruta la ejecución, activa ramas paralelas para agentes especializados y recopila sus resultados para la agregación final. El orquestador LangGraph y los agentes especializados se empaquetan juntos como un contenedor Docker.

Usamos AWS Lambda como tiempo de ejecución administrado sin servidor en AWS para que nuestros agentes de Strands escale automáticamente, responda a eventos en tiempo real y elimine la administración de infraestructura. Nuestro agente orquestador muestra su funcionalidad como interfaces REST proporcionadas por Amazon API Gateway.

Nuestra implementación de Agent utiliza AgentCore Observability para proporcionar visualizaciones detalladas de cada paso en el flujo de trabajo del agente, lo que permite a los desarrolladores inspeccionar rutas de ejecución, auditar resultados intermedios y depurar cuellos de botella en el rendimiento. Dentro de AgentCore Observability, brindamos visibilidad en tiempo real dentro de Amazon CloudWatch en paneles de rendimiento operativo y telemetría para métricas clave como seguimientos, recuento de sesiones, latencia, duración, uso de tokens y tasas de error.

Usamos AgentCore Memory para dos casos de uso clave dentro de nuestra implementación de Agent, específicamente para memoria compartida de múltiples agentes para proporcionar contexto y memoria compartida entre ejecuciones de agentes independientes y brindar soporte para conversaciones de múltiples turnos. Puede ampliar esta implementación para proporcionar una interfaz de lenguaje natural de asistente de IA, ya que nuestra implementación que utiliza AgentCore Memory proporciona soporte integrado para almacenar el estado y el historial de la conversación. El siguiente diagrama de arquitectura ilustra los diversos componentes de nuestra solución.

Requisitos previos

Complete los siguientes requisitos previos:

Verificar el acceso al modelo en Amazon Bedrock. En esta solución, utilizamos Claude 4.5 Sonnet de Anthropic en Amazon Bedrock. Instale la interfaz de línea de comandos de AWS (AWS CLI). Instale AWS SAM CLI v1.100.0+ Instale Docker v20.x+. Instalar Node.js v18.x+ Instalar Docker v20.x+ Instalar Python v3.11+

Dependencias

Nuestra implementación de Strands Agents tiene las siguientes dependencias que están empaquetadas en Dockerfile:

langchain>=0.2.0 langgraph==0.3.31 langgraph-prebuilt~=0.1.8 langgraph-sdk~=0.1.61 langchain-aws>=0.2.18 langchain_tavily solicita bedrock-agentcore boto3

Implementar la solución

Puede descargar la solución desde nuestro repositorio de GitHub. Utilice la siguiente guía paso a paso que también se describe exactamente en el archivo README del repositorio de GitHub para implementar y acceder a la solución en su entorno de AWS:

Paso 1: clonar el repositorio

clon de git

cd aws-genai-revisión-de-campaña-langgraph

Paso 2: configurar las credenciales de AWS

Configurar AWS CLI:

configurar aws

Verificar credenciales:

aws sts obtener-identidad-de-llamada

Paso 3: configurar una tabla de personas de Amazon DynamoDB

Hacer que el script sea ejecutable:

chmod +x scripts/setup_persona_table.sh

Ejecute el script de configuración:

./scripts/setup_persona_table.sh

Paso 4: cree la aplicación AWS SAM

sam construir

Paso 5: implementar infraestructura

Utilice una implementación guiada y siga las indicaciones para proporcionar el nombre de su pila, el nombre del agente, la región de AWS y acepte los valores predeterminados para otras áreas.

implementación de sam –guiada

Paso 6: obtener resultados de la implementación

Obtenga puntos finales de API:

aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas’ –tabla de salidas

Guarde estos valores:

ApiEndpoint: URL de API CampaignOrchestratorApi: URL de API del agente CloudFrontURL: URL de front-end FrontendBucket: depósito S3 para front-end

Paso 8: configurar el entorno front-end

Obtenga valores de las salidas de CloudFormation:

API_URL=$(aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`ApiEndpoint`].OutputValue’ –texto de salida)

AGENT_API_URL=$(aws cloudformation describe-stacks –stack-name -review –query ‘Pilas[0].Salidas[?OutputKey==`CampaignOrchestratorApi`].OutputValue’ –texto de salida)

Crear archivo .env:

gato > .env << EOF

VITE_API_URL=$API_URL

VITE_AGENT_API_URL=$AGENT_API_URL

VITE_AWS_REGION=

EOF

Paso 9: construir e implementar la interfaz

Instalar dependencias:

instalación npm

Construir interfaz:

compilación de ejecución npm

Obtener el nombre del depósito de interfaz:

FRONTEND_BUCKET= $(aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`FrontendBucket`].OutputValue’ –texto de salida)

Implementar en S3:

aws s3 sincronización dist/ s3://$FRONTEND_BUCKET –delete

Invalidar la caché de CloudFront (opcional, para actualizaciones):

DISTRIBUTION_ID=$(aws cloudfront listas-distribuciones –consulta “DistributionList.Items[?Origins.Items[0].DomainName==’${FRONTEND_BUCKET}.s3.us-west-2.amazonaws.com’].Id” –texto de salida)

aws cloudfront crear-invalidación –distribution-id $DISTRIBUTION_ID –paths “/*”

Paso 10: Accede a la aplicación

Obtener URL de CloudFront:

aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`CloudFrontURL`].OutputValue’ –texto de salida

Abra la URL en su navegador para acceder a la aplicación. Utilice este archivo Campaign_brief.md como documento de campaña de muestra y cárguelo en el panel izquierdo. Luego podrá ver el resultado de la revisión de la campaña desde la orquestación de múltiples agentes en el panel derecho. Navegue a la consola Bedrock AgentCore Observability y seleccione su agente para obtener una visualización detallada de cada paso en el flujo de trabajo de su agente como se muestra a continuación.

Panel de observabilidad de Agentcore que describe los intervalos, seguimientos y sesiones para las invocaciones del agente.

Limpiar

Para evitar cargos recurrentes, limpia tu cuenta después de probar la solución.

Eliminar la pila de CloudFormation

sam eliminar –nombre-pila

Eliminar tabla de DynamoDB

aws dynamodb eliminar-tabla –nombre-tabla PersonaTable –región

Conclusión

En esta publicación, mostramos cómo la combinación de LangGraph, Amazon Bedrock AgentCore y los servicios de AWS sin servidor ayuda a los equipos a crear sistemas de IA generativa de múltiples agentes altamente escalables y listos para producción. Al utilizar el modelo de ejecución explícito basado en gráficos de LangGraph para la orquestación y los tiempos de ejecución basados ​​en AWS Lambda para la ejecución, los desarrolladores pueden coordinar flujos de trabajo de agentes paralelos y complejos con un flujo de control determinista, escalado automático y una sobrecarga operativa mínima. La memoria y la observabilidad integradas de AgentCore abordan dos de los desafíos más comunes en las implementaciones de agentes del mundo real (administración del estado y visibilidad) al proporcionar un contexto compartido y duradero entre las ejecuciones de los agentes y una visión profunda del comportamiento, el rendimiento y el costo de los agentes.

Juntas, estas capacidades forman un patrón arquitectónico repetible para crear agentes de IA de nivel empresarial en AWS. Ya sea que esté implementando sistemas de revisión de campañas, asistentes digitales u otros flujos de trabajo de razonamiento de múltiples agentes, este enfoque le permite desacoplar la orquestación de la ejecución, escalar elásticamente con la demanda y mantener una transparencia total sobre cómo los agentes razonan e interactúan. Al utilizar LangGraph para la orquestación estructurada y Amazon Bedrock AgentCore para el tiempo de ejecución administrado, la memoria y la observabilidad, puede pasar con confianza de prototipos experimentales a sistemas de IA generativos confiables y escalables en producción.

Sobre los autores

Kanishk Mahajan es director de AI/ML en AWS Professional Services. En este puesto, dirige GenAI y transformaciones agentes para algunos de los clientes más importantes de AWS en telecomunicaciones, medios y entretenimiento.

Akshay Parkhi es ingeniero de aprendizaje automático en Amazon Web Services con más de 16 años de experiencia liderando la transformación empresarial en SAP, la nube, DevOps y AI/ML. Diseña y escala sistemas de inteligencia artificial y agentes de grado de producción que impulsan resultados comerciales críticos en entornos complejos del mundo real.