Google AI emite Vertex AI Memory Bank: habilitando conversaciones de agentes persistentes

Los desarrolladores están trabajando activamente para llevar a los agentes de IA al mercado, pero un obstáculo significativo ha sido el falta de memoria. Sin la capacidad de recordar interacciones pasadas, los agentes tratan cada conversación como si fuera la primera, lo que lleva a preguntas repetitivas, una incapacidad para recordar las preferencias del usuario y una falta general de personalización. Esto resulta en frustración tanto para los usuarios como para los desarrolladores.

Históricamente, los desarrolladores han intentado mitigar esto insertando diálogos de sesión completos directamente en la ventana de contexto de una LLM. Sin embargo, este enfoque es caro y computacionalmente ineficientelo que lleva a mayores costos de inferencia y tiempos de respuesta más lentos. Además, alimentar demasiada información, especialmente detalles irrelevantes, puede degradar la calidad de salida del modelo, causando problemas como “perdido en el medio” y “pudrición del contexto”.

Presentación de Vertex AI Memory Bank

Para superar estas limitaciones, Google Cloud ha anunciado la vista previa pública de Banco de memoriaun nuevo servicio administrado dentro del Motor de agente de AI Vertex. Memory Bank está diseñado para ayudarlo a construir agentes de conversación altamente personalizados que faciliten compromisos más naturales, contextuales y continuos.

Por ejemplo, aquí hay un agente de salud personalizado: información clave sobre la alergia de un usuario y los síntomas anteriores mencionados en las sesiones anteriores para proporcionar una respuesta más informada en la sesión actual

El banco de memoria aborda el problema de memoria fundamental de varias maneras clave:

  • Personalizar las interacciones: Va más allá de las secuencias de comandos genéricos al recordar las preferencias del usuario, los eventos clave y las opciones pasadas para adaptar cada respuesta.
  • Mantener la continuidad: Las conversaciones pueden retomar la perfección donde lo dejaron, incluso en múltiples sesiones que pueden abarcar días o semanas.
  • Proporcionar un mejor contexto: Los agentes están armados con los antecedentes necesarios sobre un usuario, lo que lleva a respuestas más relevantes, perspicaces y útiles.
  • Mejorar la experiencia del usuario: Elimina la frustración de los usuarios que repiten información, creando conversaciones más naturales, eficientes y atractivas.

Cómo funciona el banco de memoria

Memory Bank opera a través de un proceso inteligente de varias etapas, aprovechando los modelos Gemini de Google y la investigación novedosa:

  • Comprende y extrae recuerdos: Memory Bank analiza el historial de conversación de un usuario (almacenado en las sesiones de motor de agente) para Extraer hechos, preferencias y contexto clave. Este proceso ocurre de manera asincrónica en segundo plano, generando nuevos recuerdos sin requerir que los desarrolladores creen tuberías de extracción complejas.
  • Tiendas y actualizaciones recuerdos de manera inteligente: La información clave, como “Prefiero los días soleados” almacenado y organizado por un alcance definido, como una identificación de usuario. Cuando surge una nueva información, Memory Bank, utilizando Gemini, puede consolidarla con las recuerdos existentes, resolver contradicciones y garantizar que los recuerdos permanezcan actualizados.
  • Recuerda la información relevante: Cuando comienza una nueva sesión de conversación, el agente puede recuperar estos recuerdos almacenados. Esta recuperación puede ser un simple retiro de todos los hechos o un Búsqueda de similitud utilizando incrustaciones para encontrar recuerdos más relevantes para el tema actual. Esto asegura que el agente siempre esté equipado con el contexto correcto.

Todo este proceso se basa en El nuevo método de investigación de Google Researchaceptado por ACL 2025, que proporciona un enfoque inteligente basado en temas de cómo los agentes aprenden y recuerdan información, estableciendo un nuevo estándar para el rendimiento de la memoria del agente. Un ejemplo es cómo un agente compañero de belleza personal puede recordar el tipo de piel en evolución de un usuario para hacer recomendaciones de productos personalizadas.

Comenzando con Memory Bank

El banco de memoria está integrado con el Kit de desarrollo de agentes (ADK) y Sesiones de motor de agente. Los desarrolladores pueden definir un agente que usa ADK y permitir que las sesiones de motor de agente administraran el historial de conversación dentro de las sesiones individuales. El banco de memoria se puede habilitar para proporcionar memoria a largo plazo en múltiples sesiones.

Puede integrar el banco de memoria en su agente de dos maneras principales:

  • Desarrollar un agente con Kit de desarrollo de Google Agent (ADK) para una experiencia lista para usar.
  • Desarrolle un agente que orquesta las llamadas de API al banco de memoria si está construyendo su agente con algún otro marcoincluidos los populares como Langgraph y Crewai.

Para aquellos nuevos en Google Cloud pero usando ADK, un Registro en modo expreso Para Agent Engine Sessions and Memory Bank le permite registrarse con una cuenta de Gmail para recibir una clave API y construir dentro de las cuotas de uso de nivel gratuito antes de actualizar sin problemas a un proyecto completo de Google Cloud para la producción.


Max es analista de IA en MarktechPost, con sede en Silicon Valley, quien da forma activamente al futuro de la tecnología. Enseña robótica en Brainvyne, combate el spam con CONTRYEMAIL y aprovecha la IA diariamente para traducir los avances tecnológicos complejos en ideas claras y comprensibles