Creación de agentes de IA para soporte empresarial utilizando Amazon Bedrock AgentCore

El desarrollo de agentes de IA para soporte empresarial presenta desafíos únicos que enfrentan muchas organizaciones cuando intentan automatizar tareas rutinarias de recursos humanos. Works Human Intelligence (WHI) desarrolla, vende y respalda el sistema integrado de recursos humanos “EMPRESA” para las principales corporaciones japonesas y de interés público.

En esta publicación, compartimos cómo el Centro de innovación de IA generativa de AWS (GenAIIC) colaboró ​​con Works Human Intelligence (WHI) para crear dos agentes de IA utilizando Amazon Bedrock AgentCore. Discutimos los desafíos encontrados y las soluciones que redujeron los costos hasta en un 97% y al mismo tiempo mejoraron la eficiencia operativa.

Los clientes que utilizan sistemas de recursos humanos deben responder a numerosas situaciones, como cambios organizacionales, revisiones de los sistemas de recursos humanos y actualizaciones de la información de los empleados. Para las organizaciones que enfrentan desafíos similares con las operaciones del sistema de recursos humanos, los agentes de IA pueden reducir significativamente la carga de trabajo y mejorar la productividad. Cuando WHI se embarcó en la creación de productos utilizando agentes de IA, surgieron varios desafíos. Para resolver estos problemas, en GenAIIC trabajamos estrechamente con el equipo de WHI para brindar nuevas perspectivas y apoyo en la creación de un producto de alta calidad. El alcance de este proyecto cubre dos agentes de IA diseñados para respaldar el trabajo de los departamentos operativos. El Agente de subsidio de viaje maneja la aprobación de las solicitudes de subsidio de viaje que surgen durante eventos como una mudanza. El Agente de Operación del Navegador “EMPRESA” en nombre del cliente. Analizamos los desafíos y las soluciones para estos dos agentes en las siguientes secciones.

Agente de subsidio de desplazamiento

Este agente automatiza la aprobación de solicitudes de subsidios de viaje, que es una tarea rutinaria que surge durante eventos como reubicaciones de empleados.

Desafío

El Agente de subsidio de viaje apoya la tarea rutinaria de aprobar las solicitudes de subsidio de viaje. WHI ya estaba realizando una prueba de concepto (PoC) utilizando LangGraph, Amazon Elastic Container Service (Amazon ECS) y AWS Fargate. Sin embargo, debido a que Amazon Bedrock AgentCore se lanzó durante el desarrollo, el equipo comenzó a considerar una migración. WHI quería trabajar con nosotros para crear una solución con AgentCore que creara un agente de IA integrado con la “EMPRESA”. Además, querían migrar a un entorno integrado de múltiples agentes e implementar autenticación y autorización utilizando AWS Fargate y Amazon Cognito, que estaban actualmente en desarrollo.

Descripción general de la solución

El Commuting Allowance Agent se estaba desarrollando utilizando LangGraph y Amazon ECS, pero al equipo le preocupaba la configuración monolítica en la que todo se ejecutaba como la misma tarea de Amazon ECS. Por lo tanto, trabajamos juntos para cambiar la arquitectura de modo que los subagentes se lancen individualmente en AgentCore Runtime. Debido a que se requería soporte para múltiples inquilinos, decidimos administrar los inquilinos mediante Amazon DynamoDB y Amazon Cognito para mantener la flexibilidad de WHI para crearlo y administrarlo.

Arquitectura

Slack sirve como punto de entrada para llamar al agente de asignación de viajes diarios, por lo que el sistema está diseñado para realizar la autenticación en el momento de la llamada y luego los subagentes apropiados procesan la solicitud.

Resultados e impacto

Dado que AgentCore estuvo disponible de forma generalizada (GA) durante el proyecto, pudimos utilizarlo de forma eficaz. Si bien el agente de asignación de desplazamientos continúa usando LangGraph, lo modificamos para que los subagentes se ejecuten en un tiempo de ejecución separado. Este cambio facilita la futura expansión de subagentes. También estamos considerando cambiar el agente supervisor que agrupa a los subagentes a Strands Agents en el futuro. Además, aunque WHI anteriormente albergaba Langfuse para verificar el estado de los agentes, lo que generaba costos operativos, el cambio a AgentCore Observability ha reducido esta carga.

Agente de operación del navegador

Este agente utiliza un navegador para acceder al sistema de recursos humanos, verificar contenido, realizar operaciones y recopilar pruebas en nombre de los clientes.

Desafío

El segundo agente utiliza un navegador para acceder a “EMPRESA”, verifica el contenido, realiza operaciones y adquiere pruebas. La construcción avanzaba con LangGraph y Playwright Model Context Protocol (MCP). El equipo confirmó una reducción del 88 % en los tokens de operación del navegador mediante los siguientes enfoques:

Eliminar partes innecesarias del bucle del agente (historial de conversaciones entre AI y Playwright MCP). Eliminación de partes innecesarias para el funcionamiento del navegador de los valores de retorno de Playwright MCP. Uso del almacenamiento en caché de avisos para la parte HERRAMIENTA.

Sin embargo, debido a que dependía de una implementación patentada, el equipo enfrentó desafíos como la dificultad para migrar a Strands Agents. También estaban considerando métodos para reducir aún más los tokens. Fue en este contexto que GenAIIC comenzó a colaborar con WHI.

Descripción general de la solución

Creamos el agente utilizando Strands Agents. Después de probar varias herramientas operativas del navegador y confirmar el procesamiento exitoso, nos concentramos en reducir la cantidad de tokens utilizados. El flujo de trabajo comienza buscando la plantilla de operación óptima en la base de conocimientos de acuerdo con las instrucciones del usuario. Luego, reemplaza los marcadores de posición en la plantilla adquirida con información obtenida de otra base de conocimientos para crear un manual de operación. Luego, el agente opera el navegador según este manual para verificar la información actual. En base a la información obtenida (como CSV), crea una propuesta de cambio y la presenta al usuario. Finalmente, tras la aprobación del usuario, vuelve a operar el navegador según la propuesta de cambio para ejecutar los cambios. Aunque se define un flujo de trabajo básico, el agente puede manejar de manera flexible casos en los que la entrada del usuario es insuficiente o en los que solo se realizan tareas parciales, según su propio criterio autónomo.

Arquitectura

El acceso a “EMPRESA” por parte del agente está restringido por dirección IP. Para solucionar esto, colocamos AgentCore Runtime dentro de una nube privada virtual (VPC) y lo configuramos para acceder a través de una dirección IP fija mediante una puerta de enlace NAT. También creamos una base de conocimientos para almacenar plantillas de operación e información auxiliar para crear procedimientos de operación. Utilizamos un depósito de Amazon Simple Storage Service (Amazon S3) para guardar información a corto plazo.

arquitectura-c-sox

Resultados e impacto

El Browser Operation Agent se creó utilizando Strands Agents. Probamos las herramientas de operación del navegador, incluido el uso del navegador, Dramaturgo y dramaturgo rápido, confirmando que el dramaturgo rápido consumió la menor cantidad de tokens. Además, al colaborar en mejoras como el uso del almacenamiento en caché de avisos de Amazon Bedrock y la modificación de los avisos del sistema, logramos reducir el costo por proceso hasta en un 97 %. Las principales medidas de mejora fueron las siguientes:

Uso del almacenamiento en caché de mensajes de usuario: se habilitó la función de almacenamiento en caché de mensajes de Amazon Bedrock ($14,5 -> $2,1). Optimización del comportamiento del agente: mensajes de subagente mejorados para reducir operaciones innecesarias ($2,1 -> $1,0). Cambio de modelos: Se cambió el modelo de Claude Sonnet 4.5 a Haiku 4.5 ($1.0 -> $0.4).

A través de estas mejoras, optimizamos los costos y al mismo tiempo manejamos con éxito tareas más complejas. Estos incluyen escenarios que ejecutan múltiples cambios en sucesión o escenarios en los que el agente hace preguntas al humano cuando las instrucciones son ambiguas.

Conclusión

A través de nuestra colaboración, logramos trasladar la infraestructura de ejecución del agente de IA a AgentCore Runtime y ahora podemos verificar el estado operativo utilizando AgentCore Observability. Los miembros de WHI han declarado que el uso de AgentCore ha simplificado significativamente el desarrollo, ya que la verificación de registros ahora se realiza a través de un servicio administrado. Además, la adopción de Strands Agents para el agente de navegador nos permitió crear un agente de comportamiento flexible con una implementación mínima. En esta publicación, describimos cómo la creación de agentes de IA puede respaldar tareas rutinarias. Nuestro trabajo conjunto ha permitido a WHI alcanzar un estado en el que pueden centrarse en desarrollar la lógica empresarial. AgentCore incluye Runtime, que sirve como base de ejecución, y otras características, por lo que estamos considerando su utilización futura con WHI. Además, el comportamiento y el costo de los agentes de IA cambian con el modelo utilizado. A través de este proyecto, confirmamos que los procesos funcionan como se esperaba. Planeamos seguir evaluando modelos y optimizando costos.

Para experimentar cómo Amazon Bedrock AgentCore simplifica el desarrollo de agentes de IA, visite nuestra Guía de introducción o el laboratorio práctico. Ya sea que esté buscando automatizar tareas rutinarias, crear flujos de trabajo de múltiples agentes u optimizar los costos de los modelos utilizando funciones como el almacenamiento en caché rápido, AWS tiene las herramientas para ayudarlo.

Sobre los autores

dayuan jiang

Dayuan Jiang es arquitecto senior de aprendizaje profundo en AWS en Tokio, donde ayuda a los clientes a adoptar tecnologías de inteligencia artificial generativa como Amazon Bedrock para mejorar la eficiencia operativa e innovar en la nube. Con más de tres años de experiencia como ingeniero de IA generativa en Japón, ha liderado múltiples proyectos de clientes y contribuido a la investigación sobre la evaluación de LLM para infraestructura como código. Apasionado por hacer que la IA sea accesible, le gusta crear herramientas de código abierto y compartir conocimientos sobre LLM y ciencia de datos en su tiempo libre.

Minsup Sim es arquitecto de aprendizaje profundo en el Centro de innovación de IA generativa de AWS y se especializa en diseñar y ofrecer soluciones de IA generativa de extremo a extremo para clientes en Japón. Aprovechando su experiencia en ciencia de datos, traduce capacidades de modelos complejos en sistemas listos para producción que resuelven desafíos comerciales reales. Minsup prospera en la intersección de la rápida innovación en IA y la implementación práctica, garantizando que los clientes puedan pasar con confianza de la experimentación a la escala.

Angie Wang es estratega sénior de IA generativa en el Centro de innovación de IA generativa de AWS, donde trabaja con clientes de toda la región de Asia y el Pacífico para acelerar la adopción de la IA generativa. Con experiencia en informática e inversión de capital de riesgo, une la estrategia comercial y la ejecución técnica para ayudar a los clientes a identificar casos de uso de GenAI de alto impacto y llevarlos a producción. Angie es una estudiante permanente que se mantiene a la vanguardia de las tecnologías transformadoras de IA y le apasiona convertir los últimos avances en valor para el mundo real.

Toshio Katsurai es arquitecto de soluciones senior en el equipo ISV/SaaS de AWS Japón y ayuda a proveedores de software independientes y empresas de SaaS a crear entornos seguros, bien gobernados y con costos optimizados en AWS. Con una sólida experiencia en infraestructura y servicios de gestión y gobernanza, como AWS Organizations, AWS Control Tower y AWS Config, comparte periódicamente las mejores prácticas a través de blogs y sesiones de AWS. Le apasiona la gobernanza de la nube y le gusta apoyar a la comunidad japonesa de AWS en su tiempo libre.