Google AI emite Vertex AI Memory Bank: habilitando conversaciones de agentes persistentes

Los desarrolladores están trabajando activamente para llevar a los agentes de IA al mercado, pero un obstáculo significativo ha sido el falta de memoria. Sin la capacidad de recordar interacciones pasadas, los agentes tratan cada conversación como si fuera la primera, lo que lleva a preguntas repetitivas, una incapacidad para recordar las preferencias del usuario y una falta general de personalización. Esto resulta en frustración tanto para los usuarios como para los desarrolladores.

Históricamente, los desarrolladores han intentado mitigar esto insertando diálogos de sesión completos directamente en la ventana de contexto de una LLM. Sin embargo, este enfoque es caro y computacionalmente ineficientelo que lleva a mayores costos de inferencia y tiempos de respuesta más lentos. Además, alimentar demasiada información, especialmente detalles irrelevantes, puede degradar la calidad de salida del modelo, causando problemas como “perdido en el medio” y “pudrición del contexto”.

Presentación de Vertex AI Memory Bank

Para superar estas limitaciones, Google Cloud ha anunciado la vista previa pública de Banco de memoriaun nuevo servicio administrado dentro del Motor de agente de AI Vertex. Memory Bank está diseñado para ayudarlo a construir agentes de conversación altamente personalizados que faciliten compromisos más naturales, contextuales y continuos.

Por ejemplo, aquí hay un agente de salud personalizado: información clave sobre la alergia de un usuario y los síntomas anteriores mencionados en las sesiones anteriores para proporcionar una respuesta más informada en la sesión actual

El banco de memoria aborda el problema de memoria fundamental de varias maneras clave:

Personalizar las interacciones: Va más allá de las secuencias de comandos genéricos al recordar las preferencias del usuario, los eventos clave y las opciones pasadas para adaptar cada respuesta.
Mantener la continuidad: Las conversaciones pueden retomar la perfección donde lo dejaron, incluso en múltiples sesiones que pueden abarcar días o semanas.
Proporcionar un mejor contexto: Los agentes están armados con los antecedentes necesarios sobre un usuario, lo que lleva a respuestas más relevantes, perspicaces y útiles.
Mejorar la experiencia del usuario: Elimina la frustración de los usuarios que repiten información, creando conversaciones más naturales, eficientes y atractivas.

Cómo funciona el banco de memoria

Memory Bank opera a través de un proceso inteligente de varias etapas, aprovechando los modelos Gemini de Google y la investigación novedosa:

Comprende y extrae recuerdos: Memory Bank analiza el historial de conversación de un usuario (almacenado en las sesiones de motor de agente) para Extraer hechos, preferencias y contexto clave. Este proceso ocurre de manera asincrónica en segundo plano, generando nuevos recuerdos sin requerir que los desarrolladores creen tuberías de extracción complejas.
Tiendas y actualizaciones recuerdos de manera inteligente: La información clave, como “Prefiero los días soleados” almacenado y organizado por un alcance definido, como una identificación de usuario. Cuando surge una nueva información, Memory Bank, utilizando Gemini, puede consolidarla con las recuerdos existentes, resolver contradicciones y garantizar que los recuerdos permanezcan actualizados.
Recuerda la información relevante: Cuando comienza una nueva sesión de conversación, el agente puede recuperar estos recuerdos almacenados. Esta recuperación puede ser un simple retiro de todos los hechos o un Búsqueda de similitud utilizando incrustaciones para encontrar recuerdos más relevantes para el tema actual. Esto asegura que el agente siempre esté equipado con el contexto correcto.

Todo este proceso se basa en El nuevo método de investigación de Google Researchaceptado por ACL 2025, que proporciona un enfoque inteligente basado en temas de cómo los agentes aprenden y recuerdan información, estableciendo un nuevo estándar para el rendimiento de la memoria del agente. Un ejemplo es cómo un agente compañero de belleza personal puede recordar el tipo de piel en evolución de un usuario para hacer recomendaciones de productos personalizadas.

Comenzando con Memory Bank

El banco de memoria está integrado con el Kit de desarrollo de agentes (ADK) y Sesiones de motor de agente. Los desarrolladores pueden definir un agente que usa ADK y permitir que las sesiones de motor de agente administraran el historial de conversación dentro de las sesiones individuales. El banco de memoria se puede habilitar para proporcionar memoria a largo plazo en múltiples sesiones.

Puede integrar el banco de memoria en su agente de dos maneras principales:

Desarrollar un agente con Kit de desarrollo de Google Agent (ADK) para una experiencia lista para usar.
Desarrolle un agente que orquesta las llamadas de API al banco de memoria si está construyendo su agente con algún otro marcoincluidos los populares como Langgraph y Crewai.

Para aquellos nuevos en Google Cloud pero usando ADK, un Registro en modo expreso Para Agent Engine Sessions and Memory Bank le permite registrarse con una cuenta de Gmail para recibir una clave API y construir dentro de las cuotas de uso de nivel gratuito antes de actualizar sin problemas a un proyecto completo de Google Cloud para la producción.

Max es analista de IA en MarktechPost, con sede en Silicon Valley, quien da forma activamente al futuro de la tecnología. Enseña robótica en Brainvyne, combate el spam con CONTRYEMAIL y aprovecha la IA diariamente para traducir los avances tecnológicos complejos en ideas claras y comprensibles

Google AI emite Vertex AI Memory Bank: habilitando conversaciones de agentes persistentes

ByEquipo de 7 minutos

Presentación de Vertex AI Memory Bank

Cómo funciona el banco de memoria

Comenzando con Memory Bank

By Equipo de 7 minutos

Related Post

Tutorial de OCRmyPDF: convierta documentos escaneados en archivos PDF/A con capacidad de búsqueda con extracción de texto lateral y procesamiento por lotes

Enfrenté a XGBoost contra la regresión logística en 358 coincidencias. Ganó el modelo aburrido.

Creación de un flujo de trabajo estable de Fable 5 Traces en Colab: llamadas a herramientas de análisis, auditoría de datos y líneas de base de capacitación

You missed

Clima en Mallorca para el lunes 29 de junio: las alertas de calor son menos probables esta semana

El auge de la plantación de árboles en África está pasando por alto los árboles que alimentan a las personas

Publicar vídeos intentando que despidan al fiscal = “acoso cibernético” ilegal

Una encuesta muestra que el 47% de los españoles evita activamente los lugares de turismo masivo « Euro Weekly News