En junio, comencé una serie de publicaciones que destacan los factores clave que impulsan a los clientes a elegir La roca madre del Amazonas. La primera cubierta Creación segura de aplicaciones de IA generativas con Amazon Bedrockmientras que el segundo exploró el edificio Aplicaciones de inteligencia artificial generativa personalizadas con Amazon BedrockAhora me gustaría echar un vistazo más de cerca a Agentes de Amazon Bedrockque permite a nuestros clientes crear aplicaciones de IA generativas inteligentes y conscientes del contexto, agilizando flujos de trabajo complejos y brindando experiencias de usuario naturales y conversacionales. La aparición de grandes modelos de lenguaje (LLM) ha permitido que los humanos interactúen con las computadoras utilizando lenguaje natural. Sin embargo, muchos escenarios del mundo real exigen más que solo la comprensión del lenguaje. Implican la ejecución de flujos de trabajo complejos de varios pasos, la integración de fuentes de datos externas o la orquestación sin problemas de diversas capacidades de IA y flujos de trabajo de datos. En estos escenarios del mundo real, los agentes pueden cambiar las reglas del juego, brindando aplicaciones de IA generativas más personalizadas y transformando la forma en que interactuamos con los LLM y los usamos.
Responder consultas más complejas
Amazon Bedrock Agents permite a un desarrollador adoptar un enfoque holístico para mejorar la escalabilidad, la latencia y el rendimiento al crear aplicaciones de IA generativa. Las soluciones de IA generativa que utilizan Amazon Bedrock Agents pueden gestionar tareas complejas combinando un LLM con otras herramientas. Por ejemplo, imagine que está intentando crear un asistente habilitado para IA generativa que ayude a las personas a planificar sus vacaciones. Quiere que pueda gestionar preguntas sencillas como “¿Cómo estará el tiempo en París la semana que viene?” o “¿Cuánto cuesta volar a Tokio en julio?” Un asistente virtual básico podría responder a esas preguntas a partir de respuestas preprogramadas o buscando en Internet. Pero ¿qué sucede si alguien hace una pregunta más complicada, como “Quiero planificar un viaje a tres países el próximo verano. ¿Puedes sugerirme un itinerario de viaje que incluya visitar lugares históricos, probar la cocina local y mantenerme dentro de un presupuesto de $3,000?”. Esa es una pregunta más difícil porque implica planificar, presupuestar y encontrar información sobre diferentes destinos.
Con Amazon Bedrock Agents, un desarrollador puede crear rápidamente un asistente generativo que ayude a responder esta pregunta más complicada combinando el razonamiento del LLM con herramientas y recursos adicionales, como bases de conocimiento integradas de forma nativa para proponer itinerarios personalizados. Podría buscar vuelos, hoteles y atracciones turísticas consultando API de viajes y utilizar datos privados, información pública sobre destinos y el clima, al mismo tiempo que realiza un seguimiento del presupuesto y las preferencias del viajero. Para crear este agente, necesitaría un LLM que comprendiera y respondiera preguntas, pero también necesitaría otros módulos para planificar, presupuestar y acceder a información de viajes.
Agentes en acción
Nuestros clientes están utilizando Amazon Bedrock Agents para crear agentes (y aplicaciones impulsadas por agentes) de forma rápida y eficaz. Consideremos a Rocket, la empresa de tecnología financiera que ayuda a las personas a adquirir una vivienda propia y lograr la libertad financiera:
“Rocket está preparado para revolucionar la experiencia de compra de vivienda con tecnología de IA, y los marcos de IA de Agentic son clave para nuestra misión. Al colaborar con AWS y aprovechar Amazon Bedrock Agents, estamos mejorando la velocidad, la precisión y la personalización de nuestra comunicación impulsada por la tecnología con los clientes. Esta integración, impulsada por los 10 petabytes de datos y la experiencia en la industria de Rocket, garantiza que nuestros clientes puedan navegar momentos financieros complejos con confianza”.
– Shawn Malhotra, director de tecnología de Rocket Companies.
Una mirada más cercana a cómo trabajan los agentes
A diferencia de los LLM que ofrecen funciones de búsqueda o generación de contenido sencillas, los agentes integran varios componentes con un LLM para crear un orquestador inteligente capaz de manejar casos de uso sofisticados con un contexto matizado y experiencia en un dominio específico. La siguiente figura describe los componentes clave de Amazon Bedrock Agents:
El proceso comienza con dos partes: el LLM y el mensaje de orquestación. El LLM, que suele implementarse mediante modelos como los de la familia Anthropic Claude o los modelos Meta Llama, proporciona las capacidades básicas de razonamiento. El mensaje de orquestación es un conjunto de mensajes o instrucciones que guían al LLM al impulsar el proceso de toma de decisiones.
En las siguientes secciones, analizamos en profundidad los componentes clave de Amazon Bedrock Agents:
Planificación: un camino desde la tarea hasta los objetivos
El componente de planificación de los LLM implica comprender las tareas y diseñar estrategias de varios pasos para abordar un problema y satisfacer las necesidades del usuario. En Amazon Bedrock Agents, utilizamos cadena de pensamientos que incita en combinación con Reaccionar En la tarea de descomposición, el agente debe comprender las complejidades de una solicitud abstracta. Si seguimos explorando nuestro escenario de viaje, si un usuario quiere reservar un viaje, el agente debe reconocer que incluye transporte, alojamiento, reservas de atracciones turísticas y restaurantes. Esta capacidad de dividir una solicitud abstracta, como la planificación de un viaje, en acciones detalladas y ejecutables, es la esencia de la planificación. Sin embargo, la planificación se extiende más allá de la formulación inicial de un plan, porque durante la ejecución, el plan puede actualizarse dinámicamente. Por ejemplo, cuando el agente ha terminado de organizar el transporte y pasa a reservar el alojamiento, puede encontrarse con circunstancias en las que no haya opciones de alojamiento adecuadas que se alineen con la fecha de llegada original. En tales escenarios, el agente debe determinar si debe ampliar la búsqueda de hoteles o revisar fechas de reserva alternativas, adaptando el plan a medida que evoluciona.
Memoria: hogar de información crítica
Los agentes tienen memoria a largo y corto plazo. La memoria a corto plazo es detallada y exacta. Es relevante para la conversación actual y se restablece cuando la conversación termina. La memoria a largo plazo es episódica y recuerda hechos y detalles importantes en forma de resúmenes guardados. Estos resúmenes sirven como sinopsis de la memoria de diálogos anteriores. El agente utiliza esta información del almacén de memoria para resolver mejor la tarea actual. El almacén de memoria está separado de la memoria a largo plazo, con un almacenamiento dedicado y un componente de recuperación. Los desarrolladores tienen la opción de personalizar y controlar qué información se almacena (o se excluye) en la memoria. Una función de administración de identidad, que asocia la memoria con usuarios finales específicos, brinda a los desarrolladores la libertad de identificar y administrar usuarios finales, y permite un mayor desarrollo sobre la base de las capacidades de memoria de los agentes de Amazon Bedrock. La funcionalidad de retención de memoria líder en la industria de Amazon Bedrock, lanzada en la reciente Cumbre de Nueva York de AWS, permite a los agentes aprender y adaptarse a las preferencias de cada usuario con el tiempo, lo que permite experiencias más personalizadas y eficientes en múltiples sesiones para el mismo usuario. Es fácil de usar y permite a los usuarios comenzar con un solo clic.
Comunicación: Utilización de múltiples agentes para una mayor eficiencia y eficacia
Gracias a la potente combinación de las capacidades que hemos descrito, Amazon Bedrock Agents facilita la creación de agentes que transforman los respondedores de consultas de una sola vez en sofisticados orquestadores capaces de abordar casos de uso complejos y multifacéticos con una eficiencia y una adaptabilidad notables. Pero, ¿qué sucede con el uso de múltiples agentes? Los agentes de IA basados en LLM pueden colaborar entre sí para mejorar la eficiencia a la hora de resolver preguntas complejas. Hoy, Amazon Bedrock facilita que los desarrolladores los conecten a través de LangGraph, parte de LangChain, el popular conjunto de herramientas de código abierto. La integración de LangGraph en Amazon Bedrock permite a los usuarios aprovechar las fortalezas de múltiples agentes sin problemas, lo que fomenta un entorno colaborativo que mejora la eficiencia y la eficacia generales de los sistemas basados en LLM.
Integración de herramientas: nuevas herramientas significan nuevas capacidades
Las nuevas generaciones de modelos, como Anthropic Claude Sonnet 3.5, Meta Llama 3.1 o Amazon Titan Text Premier, están mejor equipadas para utilizar los recursos. El uso de estos recursos requiere que los desarrolladores se mantengan al día con las actualizaciones y los cambios constantes, lo que requiere nuevas indicaciones cada vez. Para reducir esta carga, Amazon Bedrock simplifica la interacción con diferentes modelos, lo que hace que sea muy fácil aprovechar todas las características que ofrece un modelo. Por ejemplo, la nueva capacidad de interpretación de código anunciada en la reciente Cumbre de AWS en Nueva York permite a los agentes de Amazon Bedrock generar y ejecutar dinámicamente fragmentos de código dentro de un entorno seguro y aislado para abordar tareas complejas como el análisis de datos, la visualización, el procesamiento de texto y la resolución de ecuaciones. También permite a los agentes procesar archivos de entrada en varios formatos (incluidos CSV, Excel y JSON) y generar gráficos a partir de los datos.
Barandillas: Construir de forma segura
La precisión es fundamental cuando se trata de consultas complejas. Los desarrolladores pueden habilitar Barandillas Bedrock de Amazon para ayudar a reducir las imprecisiones. Las barandillas mejoran el comportamiento de las aplicaciones que estás creando, aumentan la precisión y te ayudan a crearlas de manera responsable. Pueden evitar tanto las intenciones maliciosas de los usuarios como el contenido potencialmente tóxico generado por la IA, lo que proporciona un mayor nivel de seguridad y protección de la privacidad.
Ampliación y ampliación de las capacidades de la IA generativa con Amazon Bedrock Agents
Las empresas, las nuevas empresas, los ISV y los integradores de sistemas pueden aprovechar Amazon Bedrock Agents hoy mismo, ya que proporciona a los equipos de desarrollo una solución integral para crear e implementar aplicaciones de IA que pueden manejar consultas complejas, usar fuentes de datos privadas y adherirse a prácticas de IA responsables. Los desarrolladores pueden comenzar con ejemplos probados, los llamados expresiones doradas (indicaciones de entrada) y respuestas doradas (resultados esperados). Puede desarrollar continuamente agentes para que se adapten a sus principales casos de uso e impulsar el desarrollo de su aplicación de IA generativa. Los agentes abren nuevas oportunidades significativas para crear aplicaciones de IA generativa que transformen verdaderamente su negocio. Será fascinante ver las soluciones (y los resultados) que inspira Amazon Bedrock Agents.
Recursos
Para obtener más información sobre la personalización con Amazon Bedrock, consulte los siguientes recursos:
Acerca del autor
Vasi Philomin es vicepresidente de IA generativa en AWS. Lidera iniciativas de IA generativa, incluidas Amazon Bedrock y Amazon Titan.