El desarrollo de agentes de IA para soporte empresarial presenta desafíos únicos que enfrentan muchas organizaciones cuando intentan automatizar tareas rutinarias de recursos humanos. Works Human Intelligence (WHI) desarrolla, vende y respalda el sistema integrado de recursos humanos “EMPRESA” para las principales corporaciones japonesas y de interés público.
En esta publicación, compartimos cómo el Centro de innovación de IA generativa de AWS (GenAIIC) colaboró con Works Human Intelligence (WHI) para crear dos agentes de IA utilizando Amazon Bedrock AgentCore. Discutimos los desafíos encontrados y las soluciones que redujeron los costos hasta en un 97% y al mismo tiempo mejoraron la eficiencia operativa.
Los clientes que utilizan sistemas de recursos humanos deben responder a numerosas situaciones, como cambios organizacionales, revisiones de los sistemas de recursos humanos y actualizaciones de la información de los empleados. Para las organizaciones que enfrentan desafíos similares con las operaciones del sistema de recursos humanos, los agentes de IA pueden reducir significativamente la carga de trabajo y mejorar la productividad. Cuando WHI se embarcó en la creación de productos utilizando agentes de IA, surgieron varios desafíos. Para resolver estos problemas, en GenAIIC trabajamos estrechamente con el equipo de WHI para brindar nuevas perspectivas y apoyo en la creación de un producto de alta calidad. El alcance de este proyecto cubre dos agentes de IA diseñados para respaldar el trabajo de los departamentos operativos. El Agente de subsidio de viaje maneja la aprobación de las solicitudes de subsidio de viaje que surgen durante eventos como una mudanza. El Agente de Operación del Navegador “EMPRESA” en nombre del cliente. Analizamos los desafíos y las soluciones para estos dos agentes en las siguientes secciones.
Agente de subsidio de desplazamiento
Este agente automatiza la aprobación de solicitudes de subsidios de viaje, que es una tarea rutinaria que surge durante eventos como reubicaciones de empleados.
Desafío
El Agente de subsidio de viaje apoya la tarea rutinaria de aprobar las solicitudes de subsidio de viaje. WHI ya estaba realizando una prueba de concepto (PoC) utilizando LangGraph, Amazon Elastic Container Service (Amazon ECS) y AWS Fargate. Sin embargo, debido a que Amazon Bedrock AgentCore se lanzó durante el desarrollo, el equipo comenzó a considerar una migración. WHI quería trabajar con nosotros para crear una solución con AgentCore que creara un agente de IA integrado con la “EMPRESA”. Además, querían migrar a un entorno integrado de múltiples agentes e implementar autenticación y autorización utilizando AWS Fargate y Amazon Cognito, que estaban actualmente en desarrollo.
Descripción general de la solución
El Commuting Allowance Agent se estaba desarrollando utilizando LangGraph y Amazon ECS, pero al equipo le preocupaba la configuración monolítica en la que todo se ejecutaba como la misma tarea de Amazon ECS. Por lo tanto, trabajamos juntos para cambiar la arquitectura de modo que los subagentes se lancen individualmente en AgentCore Runtime. Debido a que se requería soporte para múltiples inquilinos, decidimos administrar los inquilinos mediante Amazon DynamoDB y Amazon Cognito para mantener la flexibilidad de WHI para crearlo y administrarlo.
Arquitectura
Slack sirve como punto de entrada para llamar al agente de asignación de viajes diarios, por lo que el sistema está diseñado para realizar la autenticación en el momento de la llamada y luego los subagentes apropiados procesan la solicitud.
Resultados e impacto
Dado que AgentCore estuvo disponible de forma generalizada (GA) durante el proyecto, pudimos utilizarlo de forma eficaz. Si bien el agente de asignación de desplazamientos continúa usando LangGraph, lo modificamos para que los subagentes se ejecuten en un tiempo de ejecución separado. Este cambio facilita la futura expansión de subagentes. También estamos considerando cambiar el agente supervisor que agrupa a los subagentes a Strands Agents en el futuro. Además, aunque WHI anteriormente albergaba Langfuse para verificar el estado de los agentes, lo que generaba costos operativos, el cambio a AgentCore Observability ha reducido esta carga.
Agente de operación del navegador
Este agente utiliza un navegador para acceder al sistema de recursos humanos, verificar contenido, realizar operaciones y recopilar pruebas en nombre de los clientes.
Desafío
El segundo agente utiliza un navegador para acceder a “EMPRESA”, verifica el contenido, realiza operaciones y adquiere pruebas. La construcción avanzaba con LangGraph y Playwright Model Context Protocol (MCP). El equipo confirmó una reducción del 88 % en los tokens de operación del navegador mediante los siguientes enfoques:
Eliminar partes innecesarias del bucle del agente (historial de conversaciones entre AI y Playwright MCP). Eliminación de partes innecesarias para el funcionamiento del navegador de los valores de retorno de Playwright MCP. Uso del almacenamiento en caché de avisos para la parte HERRAMIENTA.
Sin embargo, debido a que dependía de una implementación patentada, el equipo enfrentó desafíos como la dificultad para migrar a Strands Agents. También estaban considerando métodos para reducir aún más los tokens. Fue en este contexto que GenAIIC comenzó a colaborar con WHI.
Descripción general de la solución
Creamos el agente utilizando Strands Agents. Después de probar varias herramientas operativas del navegador y confirmar el procesamiento exitoso, nos concentramos en reducir la cantidad de tokens utilizados. El flujo de trabajo comienza buscando la plantilla de operación óptima en la base de conocimientos de acuerdo con las instrucciones del usuario. Luego, reemplaza los marcadores de posición en la plantilla adquirida con información obtenida de otra base de conocimientos para crear un manual de operación. Luego, el agente opera el navegador según este manual para verificar la información actual. En base a la información obtenida (como CSV), crea una propuesta de cambio y la presenta al usuario. Finalmente, tras la aprobación del usuario, vuelve a operar el navegador según la propuesta de cambio para ejecutar los cambios. Aunque se define un flujo de trabajo básico, el agente puede manejar de manera flexible casos en los que la entrada del usuario es insuficiente o en los que solo se realizan tareas parciales, según su propio criterio autónomo.
Arquitectura
El acceso a “EMPRESA” por parte del agente está restringido por dirección IP. Para solucionar esto, colocamos AgentCore Runtime dentro de una nube privada virtual (VPC) y lo configuramos para acceder a través de una dirección IP fija mediante una puerta de enlace NAT. También creamos una base de conocimientos para almacenar plantillas de operación e información auxiliar para crear procedimientos de operación. Utilizamos un depósito de Amazon Simple Storage Service (Amazon S3) para guardar información a corto plazo.
Resultados e impacto
El Browser Operation Agent se creó utilizando Strands Agents. Probamos las herramientas de operación del navegador, incluido el uso del navegador, Dramaturgo y dramaturgo rápido, confirmando que el dramaturgo rápido consumió la menor cantidad de tokens. Además, al colaborar en mejoras como el uso del almacenamiento en caché de avisos de Amazon Bedrock y la modificación de los avisos del sistema, logramos reducir el costo por proceso hasta en un 97 %. Las principales medidas de mejora fueron las siguientes:
Uso del almacenamiento en caché de mensajes de usuario: se habilitó la función de almacenamiento en caché de mensajes de Amazon Bedrock ($14,5 -> $2,1). Optimización del comportamiento del agente: mensajes de subagente mejorados para reducir operaciones innecesarias ($2,1 -> $1,0). Cambio de modelos: Se cambió el modelo de Claude Sonnet 4.5 a Haiku 4.5 ($1.0 -> $0.4).
A través de estas mejoras, optimizamos los costos y al mismo tiempo manejamos con éxito tareas más complejas. Estos incluyen escenarios que ejecutan múltiples cambios en sucesión o escenarios en los que el agente hace preguntas al humano cuando las instrucciones son ambiguas.
Conclusión
A través de nuestra colaboración, logramos trasladar la infraestructura de ejecución del agente de IA a AgentCore Runtime y ahora podemos verificar el estado operativo utilizando AgentCore Observability. Los miembros de WHI han declarado que el uso de AgentCore ha simplificado significativamente el desarrollo, ya que la verificación de registros ahora se realiza a través de un servicio administrado. Además, la adopción de Strands Agents para el agente de navegador nos permitió crear un agente de comportamiento flexible con una implementación mínima. En esta publicación, describimos cómo la creación de agentes de IA puede respaldar tareas rutinarias. Nuestro trabajo conjunto ha permitido a WHI alcanzar un estado en el que pueden centrarse en desarrollar la lógica empresarial. AgentCore incluye Runtime, que sirve como base de ejecución, y otras características, por lo que estamos considerando su utilización futura con WHI. Además, el comportamiento y el costo de los agentes de IA cambian con el modelo utilizado. A través de este proyecto, confirmamos que los procesos funcionan como se esperaba. Planeamos seguir evaluando modelos y optimizando costos.
Para experimentar cómo Amazon Bedrock AgentCore simplifica el desarrollo de agentes de IA, visite nuestra Guía de introducción o el laboratorio práctico. Ya sea que esté buscando automatizar tareas rutinarias, crear flujos de trabajo de múltiples agentes u optimizar los costos de los modelos utilizando funciones como el almacenamiento en caché rápido, AWS tiene las herramientas para ayudarlo.