La IA generativa ha evolucionado rápidamente desde prototipos experimentales hasta sistemas que se espera que funcionen de manera confiable en producción, a escala y bajo limitaciones de desempeño del mundo real. A medida que las organizaciones van más allá de las demostraciones y pruebas de concepto, se enfrentan cada vez más a desafíos relacionados con la latencia de inferencia, la escalabilidad, la gestión del estado y la visibilidad operativa. Hoy en día, crear agentes de IA de alto rendimiento requiere más que modelos potentes y exige una implementación que pueda ofrecer un rendimiento consistente, preservar el contexto en todas las interacciones y proporcionar una observabilidad profunda de cómo los agentes razonan y se comportan en producción.
En esta publicación, brindamos una solución para crear sistemas de IA generativa de múltiples agentes sin servidor y altamente escalables en AWS utilizando LangGraph Agents como orquestadores integrados con Amazon Bedrock AgentCore Memory y Amazon Bedrock AgentCore Observability.
Nuestro enfoque para crear orquestaciones multiagente sin servidor altamente escalables combina tecnologías sin servidor como AWS Lambda y AWS Step Functions. Los desarrolladores pueden utilizar estos servicios para crear agentes LangGraph que se escalen automáticamente, respondan a eventos en tiempo real y eliminen la administración de infraestructura. Esto los hace ideales para cargas de trabajo de agentes dinámicas y en ráfagas. Al combinar estos servicios, puede orquestar flujos de trabajo de agentes complejos con múltiples herramientas con administración de estado duradera, reintentos y control de costos detallado.
El modelo de ejecución explícito basado en gráficos de LangGraph permite la coordinación determinista, el paralelismo y el enrutamiento condicional entre agentes, lo que hace que los flujos de trabajo complejos de múltiples agentes sean más sencillos de razonar y depurar. Al separar la lógica de orquestación del comportamiento de los agentes, puede utilizar LangGraph para agregar, eliminar o desarrollar agentes especializados de forma independiente mientras mantiene una ruta de ejecución clara y auditable. Esto es especialmente valioso para los sistemas de producción que requieren comportamiento predecible, extensibilidad y control estructurado sobre el razonamiento de múltiples agentes.
AgentCore Observability amplía estas capacidades al proporcionar visibilidad detallada de cada invocación, capturando entradas/salidas del modelo, latencia y métricas de la cadena de herramientas en componentes distribuidos sin servidor. Los servicios de memoria integrados de AgentCore Memory permiten a los agentes mantener un contexto conversacional a corto plazo y conocimientos a largo plazo durante las sesiones.
Descripción general de la solución
Nuestra solución de sistema de orquestación de múltiples agentes basada en LangGraph y AgentCore sin servidor es un sistema generativo de revisión de campañas de múltiples agentes impulsado por IA que organiza revisiones humanas utilizando diversas personas que permiten que las campañas de marketing resuenen auténticamente con las audiencias objetivo mientras mantienen la alineación legal y los estándares de marca. Consta de tres agentes de inteligencia artificial especializados que analizan la campaña de marketing en paralelo: un agente revisor personal revisa el contenido desde diversas perspectivas demográficas y proporciona puntuación de resonancia, un agente validador verifica la alineación legal y el cumplimiento de las pautas de la marca, mientras que un agente finalizador sintetiza los comentarios en recomendaciones procesables. Los usuarios cargan documentos de campaña a través de una interfaz de React que también busca resultados y muestra reseñas a medida que están disponibles.
Usamos LangGraph para implementar el orquestador y los agentes especializados modelando el sistema como un gráfico de ejecución con estado. Cada nodo representa una función de agente discreta, específicamente revisión de personas, validación de cumplimiento y síntesis de retroalimentación, y los bordes definen el flujo de control entre estos pasos. El orquestador se implementa como el gráfico de supervisión que enruta la ejecución, activa ramas paralelas para agentes especializados y recopila sus resultados para la agregación final. El orquestador LangGraph y los agentes especializados se empaquetan juntos como un contenedor Docker.
Usamos AWS Lambda como tiempo de ejecución administrado sin servidor en AWS para que nuestros agentes de Strands escale automáticamente, responda a eventos en tiempo real y elimine la administración de infraestructura. Nuestro agente orquestador muestra su funcionalidad como interfaces REST proporcionadas por Amazon API Gateway.
Nuestra implementación de Agent utiliza AgentCore Observability para proporcionar visualizaciones detalladas de cada paso en el flujo de trabajo del agente, lo que permite a los desarrolladores inspeccionar rutas de ejecución, auditar resultados intermedios y depurar cuellos de botella en el rendimiento. Dentro de AgentCore Observability, brindamos visibilidad en tiempo real dentro de Amazon CloudWatch en paneles de rendimiento operativo y telemetría para métricas clave como seguimientos, recuento de sesiones, latencia, duración, uso de tokens y tasas de error.
Usamos AgentCore Memory para dos casos de uso clave dentro de nuestra implementación de Agent, específicamente para memoria compartida de múltiples agentes para proporcionar contexto y memoria compartida entre ejecuciones de agentes independientes y brindar soporte para conversaciones de múltiples turnos. Puede ampliar esta implementación para proporcionar una interfaz de lenguaje natural de asistente de IA, ya que nuestra implementación que utiliza AgentCore Memory proporciona soporte integrado para almacenar el estado y el historial de la conversación. El siguiente diagrama de arquitectura ilustra los diversos componentes de nuestra solución.
Requisitos previos
Complete los siguientes requisitos previos:
Verificar el acceso al modelo en Amazon Bedrock. En esta solución, utilizamos Claude 4.5 Sonnet de Anthropic en Amazon Bedrock. Instale la interfaz de línea de comandos de AWS (AWS CLI). Instale AWS SAM CLI v1.100.0+ Instale Docker v20.x+. Instalar Node.js v18.x+ Instalar Docker v20.x+ Instalar Python v3.11+
Dependencias
Nuestra implementación de Strands Agents tiene las siguientes dependencias que están empaquetadas en Dockerfile:
langchain>=0.2.0 langgraph==0.3.31 langgraph-prebuilt~=0.1.8 langgraph-sdk~=0.1.61 langchain-aws>=0.2.18 langchain_tavily solicita bedrock-agentcore boto3
Implementar la solución
Puede descargar la solución desde nuestro repositorio de GitHub. Utilice la siguiente guía paso a paso que también se describe exactamente en el archivo README del repositorio de GitHub para implementar y acceder a la solución en su entorno de AWS:
Paso 1: clonar el repositorio
clon de git
cd aws-genai-revisión-de-campaña-langgraph
Paso 2: configurar las credenciales de AWS
Configurar AWS CLI:
configurar aws
Verificar credenciales:
aws sts obtener-identidad-de-llamada
Paso 3: configurar una tabla de personas de Amazon DynamoDB
Hacer que el script sea ejecutable:
chmod +x scripts/setup_persona_table.sh
Ejecute el script de configuración:
./scripts/setup_persona_table.sh
Paso 4: cree la aplicación AWS SAM
sam construir
Paso 5: implementar infraestructura
Utilice una implementación guiada y siga las indicaciones para proporcionar el nombre de su pila, el nombre del agente, la región de AWS y acepte los valores predeterminados para otras áreas.
implementación de sam –guiada
Paso 6: obtener resultados de la implementación
Obtenga puntos finales de API:
aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas’ –tabla de salidas
Guarde estos valores:
ApiEndpoint: URL de API CampaignOrchestratorApi: URL de API del agente CloudFrontURL: URL de front-end FrontendBucket: depósito S3 para front-end
Paso 8: configurar el entorno front-end
Obtenga valores de las salidas de CloudFormation:
API_URL=$(aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`ApiEndpoint`].OutputValue’ –texto de salida)
AGENT_API_URL=$(aws cloudformation describe-stacks –stack-name -review –query ‘Pilas[0].Salidas[?OutputKey==`CampaignOrchestratorApi`].OutputValue’ –texto de salida)
Crear archivo .env:
gato > .env << EOF
VITE_API_URL=$API_URL
VITE_AGENT_API_URL=$AGENT_API_URL
VITE_AWS_REGION=
EOF
Paso 9: construir e implementar la interfaz
Instalar dependencias:
instalación npm
Construir interfaz:
compilación de ejecución npm
Obtener el nombre del depósito de interfaz:
FRONTEND_BUCKET= $(aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`FrontendBucket`].OutputValue’ –texto de salida)
Implementar en S3:
aws s3 sincronización dist/ s3://$FRONTEND_BUCKET –delete
Invalidar la caché de CloudFront (opcional, para actualizaciones):
DISTRIBUTION_ID=$(aws cloudfront listas-distribuciones –consulta “DistributionList.Items[?Origins.Items[0].DomainName==’${FRONTEND_BUCKET}.s3.us-west-2.amazonaws.com’].Id” –texto de salida)
aws cloudfront crear-invalidación –distribution-id $DISTRIBUTION_ID –paths “/*”
Paso 10: Accede a la aplicación
Obtener URL de CloudFront:
aws cloudformation describe-stacks –stack-name –query ‘Pilas[0].Salidas[?OutputKey==`CloudFrontURL`].OutputValue’ –texto de salida
Abra la URL en su navegador para acceder a la aplicación. Utilice este archivo Campaign_brief.md como documento de campaña de muestra y cárguelo en el panel izquierdo. Luego podrá ver el resultado de la revisión de la campaña desde la orquestación de múltiples agentes en el panel derecho. Navegue a la consola Bedrock AgentCore Observability y seleccione su agente para obtener una visualización detallada de cada paso en el flujo de trabajo de su agente como se muestra a continuación.
Limpiar
Para evitar cargos recurrentes, limpia tu cuenta después de probar la solución.
Eliminar la pila de CloudFormation
sam eliminar –nombre-pila
Eliminar tabla de DynamoDB
aws dynamodb eliminar-tabla –nombre-tabla PersonaTable –región
Conclusión
En esta publicación, mostramos cómo la combinación de LangGraph, Amazon Bedrock AgentCore y los servicios de AWS sin servidor ayuda a los equipos a crear sistemas de IA generativa de múltiples agentes altamente escalables y listos para producción. Al utilizar el modelo de ejecución explícito basado en gráficos de LangGraph para la orquestación y los tiempos de ejecución basados en AWS Lambda para la ejecución, los desarrolladores pueden coordinar flujos de trabajo de agentes paralelos y complejos con un flujo de control determinista, escalado automático y una sobrecarga operativa mínima. La memoria y la observabilidad integradas de AgentCore abordan dos de los desafíos más comunes en las implementaciones de agentes del mundo real (administración del estado y visibilidad) al proporcionar un contexto compartido y duradero entre las ejecuciones de los agentes y una visión profunda del comportamiento, el rendimiento y el costo de los agentes.
Juntas, estas capacidades forman un patrón arquitectónico repetible para crear agentes de IA de nivel empresarial en AWS. Ya sea que esté implementando sistemas de revisión de campañas, asistentes digitales u otros flujos de trabajo de razonamiento de múltiples agentes, este enfoque le permite desacoplar la orquestación de la ejecución, escalar elásticamente con la demanda y mantener una transparencia total sobre cómo los agentes razonan e interactúan. Al utilizar LangGraph para la orquestación estructurada y Amazon Bedrock AgentCore para el tiempo de ejecución administrado, la memoria y la observabilidad, puede pasar con confianza de prototipos experimentales a sistemas de IA generativos confiables y escalables en producción.
Sobre los autores
Kanishk Mahajan es director de AI/ML en AWS Professional Services. En este puesto, dirige GenAI y transformaciones agentes para algunos de los clientes más importantes de AWS en telecomunicaciones, medios y entretenimiento.
Akshay Parkhi es ingeniero de aprendizaje automático en Amazon Web Services con más de 16 años de experiencia liderando la transformación empresarial en SAP, la nube, DevOps y AI/ML. Diseña y escala sistemas de inteligencia artificial y agentes de grado de producción que impulsan resultados comerciales críticos en entornos complejos del mundo real.