Automatización de control de calidad agente mediante Amazon Bedrock AgentCore Browser y Amazon Nova Act

Las pruebas de control de calidad (QA) han sido durante mucho tiempo la columna vertebral del desarrollo de software, pero los enfoques tradicionales de control de calidad no han seguido el ritmo de los ciclos de desarrollo modernos y las interfaces de usuario complejas. La mayoría de las organizaciones todavía dependen de un enfoque híbrido que combina pruebas manuales con marcos de automatización basados ​​en scripts como Selenium, Cypress y Playwright; sin embargo, los equipos dedican una gran cantidad de tiempo a mantener la automatización de pruebas existente en lugar de crear nuevas pruebas. El problema es que la automatización tradicional es frágil. Los scripts de prueba no coinciden con los cambios de la interfaz de usuario, requieren conocimientos de programación especializados y, a menudo, brindan una cobertura incompleta en todos los navegadores y dispositivos. Dado que muchas organizaciones exploran activamente flujos de trabajo de pruebas impulsados ​​por IA, los enfoques actuales son insuficientes.

En esta publicación, exploramos cómo la automatización de control de calidad agente aborda estos desafíos y analizamos un ejemplo práctico utilizando Amazon Bedrock AgentCore Browser y Amazon Nova Act para automatizar las pruebas de una aplicación minorista de muestra.

Beneficios de las pruebas de control de calidad agentes

La IA agente hace que las pruebas de control de calidad pasen de la automatización basada en reglas a sistemas de pruebas inteligentes y autónomos. A diferencia de la automatización convencional que sigue guiones preprogramados, la IA agente puede observar, aprender, adaptarse y tomar decisiones en tiempo real. Las ventajas clave incluyen la generación de pruebas autónomas a través de la observación de la interfaz de usuario y la adaptación dinámica a medida que cambian los elementos de la interfaz de usuario, lo que minimiza la sobrecarga de mantenimiento que consume el tiempo de los equipos de control de calidad. Estos sistemas imitan los patrones de interacción humana, asegurando que las pruebas se realicen desde la perspectiva del usuario genuino en lugar de a través de vías rígidas y programadas.

Navegador AgentCore para pruebas de control de calidad agentes a gran escala

Para aprovechar el potencial de las pruebas de IA agentes a escala empresarial, las organizaciones necesitan una infraestructura sólida que pueda soportar agentes de pruebas inteligentes y autónomos. AgentCore Browser, una herramienta integrada de Amazon Bedrock AgentCore, aborda esta necesidad proporcionando un entorno de navegador seguro basado en la nube diseñado específicamente para que los agentes de IA interactúen con sitios web y aplicaciones.

AgentCore Browser incluye funciones de seguridad empresarial esenciales, como aislamiento de sesiones, observabilidad integrada a través de visualización en vivo, registro de AWS CloudTrail y capacidades de reproducción de sesiones. Al operar dentro de un entorno efímero en contenedores, cada instancia del navegador se puede cerrar después de su uso, lo que proporciona estados de prueba limpios y una gestión óptima de los recursos. Para operaciones de control de calidad a gran escala, AgentCore Browser puede ejecutar varias sesiones de navegador simultáneamente, de modo que las organizaciones puedan realizar pruebas en paralelo en diferentes escenarios, entornos y recorridos de usuario simultáneamente.

Control de calidad agente con el SDK de Amazon Nova Act

Las capacidades de infraestructura de AgentCore Browser se vuelven realmente poderosas cuando se combinan con un SDK agente como Amazon Nova Act. Amazon Nova Act es un servicio de AWS que ayuda a los desarrolladores a crear, implementar y administrar flotas de agentes de IA confiables para automatizar los flujos de trabajo de la interfaz de usuario de producción. Con este SDK, los desarrolladores pueden dividir flujos de trabajo de prueba complejos en comandos más pequeños y confiables, manteniendo al mismo tiempo la capacidad de llamar a las API y realizar manipulación directa del navegador según sea necesario. Este enfoque ofrece una integración perfecta del código Python durante todo el proceso de prueba. Los desarrolladores pueden intercalar pruebas, puntos de interrupción y aserciones directamente dentro del flujo de trabajo agente, proporcionando capacidades de control y depuración sin precedentes. Esta combinación de la infraestructura de nube de AgentCore Browser con el SDK agente de Amazon Nova Act crea un ecosistema de pruebas integral que transforma la forma en que las organizaciones abordan el control de calidad.

Implementación práctica: pruebas de aplicaciones minoristas

Para ilustrar esta transformación en la práctica, consideremos el desarrollo de una nueva aplicación para una empresa minorista. Hemos creado una aplicación web minorista simulada para demostrar el proceso de control de calidad de la agencia, asumiendo que la aplicación está alojada en la infraestructura de AWS dentro de una red empresarial privada durante las fases de desarrollo y prueba.

Para agilizar el proceso de creación de pruebas, utilizamos Kiro, un asistente de codificación impulsado por IA para generar automáticamente casos de prueba de UI analizando la base del código de nuestra aplicación. Kiro examina la estructura de la aplicación, revisa los patrones de prueba existentes y crea casos de prueba integrales siguiendo el formato de esquema JSON requerido por la Ley Amazon Nova. Al comprender las características de la aplicación, incluida la navegación, la búsqueda, el filtrado y el envío de formularios, Kiro genera pasos de prueba detallados con acciones y resultados esperados que se pueden ejecutar inmediatamente a través de AgentCore Browser. Este enfoque asistido por IA acelera drásticamente la creación de pruebas y al mismo tiempo proporciona una cobertura integral. La siguiente demostración muestra a Kiro generando 15 casos de prueba listos para usar para nuestra aplicación de demostración de pruebas de control de calidad.

Una vez generados los casos de prueba, se colocan en el directorio de datos de prueba donde pytest los descubre y ejecuta automáticamente. Cada archivo de prueba JSON se convierte en una prueba independiente que pytest puede ejecutar en paralelo. El marco utiliza pytest-xdist para distribuir pruebas entre múltiples procesos de trabajo, utilizando automáticamente los recursos disponibles del sistema para un rendimiento óptimo.

Durante la ejecución, cada prueba obtiene su propia sesión aislada del navegador AgentCore a través del SDK de Amazon Nova Act. El agente de Amazon Nova Act lee los pasos de prueba del archivo JSON y los ejecuta: realiza acciones como hacer clic en botones o completar formularios y luego valida que se produzcan los resultados esperados. Este enfoque basado en datos significa que los equipos pueden crear conjuntos de pruebas integrales simplemente escribiendo archivos JSON, sin necesidad de escribir código Python para cada escenario de prueba. La arquitectura de ejecución paralela reduce significativamente el tiempo de prueba. Las pruebas que normalmente se ejecutarían secuencialmente ahora se pueden ejecutar simultáneamente en múltiples sesiones del navegador, y pytest administra la distribución y agregación de los resultados. Se genera automáticamente un informe HTML utilizando pytest-html y el complemento pytest-html-nova-act, que proporciona resultados de pruebas, capturas de pantalla y registros de ejecución para una visibilidad completa del proceso de prueba.

Una de las capacidades más poderosas de AgentCore Browser es su capacidad de ejecutar múltiples sesiones de navegador simultáneamente, lo que permite una verdadera ejecución de pruebas paralelas a escala. Cuando pytest distribuye pruebas entre procesos de trabajo, cada prueba genera su propia sesión de navegador aislada en la nube. Esto significa que todo su conjunto de pruebas puede ejecutarse simultáneamente en lugar de esperar a que cada prueba se complete de forma secuencial.

La Consola de administración de AWS proporciona visibilidad completa de estas sesiones paralelas. Como se demuestra en el siguiente video, puede ver las sesiones activas del navegador que se ejecutan simultáneamente, monitorear su estado y realizar un seguimiento de la utilización de recursos en tiempo real. Esta observabilidad es fundamental para comprender los patrones de ejecución de pruebas y optimizar su infraestructura de pruebas.

Más allá de simplemente monitorear el estado de la sesión, AgentCore Browser ofrece funciones de visualización en vivo y reproducción de sesiones para observar exactamente lo que hace Amazon Nova Act durante y después de la ejecución de la prueba. Para una sesión de navegador activa, puede abrir la vista en vivo y observar al agente interactuando con su aplicación en tiempo real: haciendo clic en botones, completando formularios, navegando por páginas y validando resultados. Cuando habilita la reproducción de la sesión, puede ver los eventos grabados reproduciendo la sesión grabada. Esto le permite validar los resultados de la prueba incluso después de que se complete la ejecución de la prueba. Estas capacidades son invaluables para depurar fallas de prueba, comprender el comportamiento de los agentes y ganar confianza en su proceso de prueba automatizado.

Para obtener instrucciones de implementación completas y acceso al código de aplicación minorista de muestra, las plantillas de AWS CloudFormation y el marco de pruebas de pytest, consulte el repositorio de GitHub adjunto. El repositorio incluye los componentes necesarios para implementar y probar la aplicación en su propio entorno de AWS.

Conclusión

En esta publicación, analizamos cómo AgentCore Browser puede ayudar a paralelizar las pruebas de control de calidad agentes para aplicaciones web. Un agente como Amazon Nova Act puede realizar pruebas de control de calidad automatizadas con alta confiabilidad.

Sobre los autores

Kosti Vasilakakis es PM principal en AWS en el equipo de Agentic AI, donde ha dirigido el diseño y desarrollo de varios servicios Bedrock AgentCore desde cero, incluidos Runtime, Browser, Code Interpreter e Identity. Anteriormente trabajó en Amazon SageMaker desde sus inicios, lanzando capacidades de IA/ML que ahora utilizan miles de empresas en todo el mundo. Al principio de su carrera, Kosti fue científico de datos. Fuera del trabajo, crea automatizaciones de productividad personal, juega tenis y disfruta de la vida con su esposa e hijos.

Veda Raman es arquitecto senior de soluciones para IA generativa para Amazon Nova y Agentic AI en AWS. Ayuda a los clientes a diseñar y crear soluciones de IA Agentic utilizando modelos de Amazon Nova y Bedrock AgentCore. Anteriormente trabajó con clientes creando soluciones de aprendizaje automático utilizando Amazon SageMaker y también como arquitecta de soluciones sin servidor en AWS.

Omkar Nyalpelly es arquitecto de infraestructura en la nube en AWS Professional Services con amplia experiencia en AWS Landing Zones y metodologías DevOps. Su enfoque actual se centra en la intersección de la infraestructura de la nube y las tecnologías de IA, aprovechando específicamente la IA generativa y los sistemas de IA agente para construir entornos de nube autónomos y autoadministrables. A través de su trabajo con clientes empresariales, Omkar explora enfoques innovadores para reducir los gastos operativos y al mismo tiempo mejorar la confiabilidad del sistema. Aparte de sus actividades técnicas, le gusta jugar cricket, béisbol y explorar la fotografía creativa. Tiene una maestría en Redes y Telecomunicaciones de la Universidad Metodista del Sur.

Ryan Canty es arquitecto de soluciones en Amazon AGI Labs con más de 10 años de experiencia en ingeniería de software y se especializa en diseñar y escalar sistemas de software empresarial en múltiples pilas de tecnología. Trabaja con clientes para aprovechar Amazon Nova Act, un servicio de AWS para crear e implementar agentes de IA altamente confiables que automatizan flujos de trabajo basados ​​en UI a escala, cerrando la brecha entre las capacidades de IA de vanguardia y las aplicaciones comerciales prácticas.