Memoria del agente Tencent DB de código abierto de Tencent: una canalización de memoria local de 4 niveles para agentes de IA

Tencent ha lanzado TencentDB Agent Memory, un sistema de memoria de código abierto para agentes de IA. El proyecto se envía bajo la licencia del MIT. Se centra en un problema familiar para cualquiera que envíe agentes con un horizonte a largo plazo: el exceso de contexto y los fallos en la recuperación.

Es una memoria simbólica a corto plazo junto con una memoria a largo plazo en capas. Se integra con OpenClaw como complemento y con Hermes Agent a través de un adaptador Gateway. El backend predeterminado es SQLite local con la extensión sqlite-vec, por lo que no se requiere API externa.

Por qué la memoria del agente es difícil

La mayoría de las pilas de memoria actuales trituran los datos en fragmentos y los descargan en un almacén de vectores planos. La recuperación se convierte entonces en una búsqueda ciega de similitudes entre fragmentos desconectados, sin guía a nivel macro. La arquitectura se basa en dos pilares: la memoria en capas y la memoria simbólica.

Una pirámide semántica de 4 niveles

Para una personalización a largo plazo, TencentDB Agent Memory construye una pirámide de cuatro niveles en lugar de un registro plano. Las capas son L0 Conversación, L1 Átomo, L2 Escenario y L3 Persona. Estos corresponden a diálogos sin formato, hechos atómicos, bloques de escenas y un perfil de usuario.

La capa Persona contiene las preferencias del usuario del día a día y se consulta primero. El sistema desglosa los átomos o las conversaciones sin procesar solo cuando se necesitan detalles más finos. Las capas inferiores preservan la evidencia; las capas superiores preservan la estructura.

El almacenamiento es heterogéneo. Los hechos, registros y rastreos se conservan en bases de datos para su recuperación de texto completo. Las personas, escenas y lienzos se almacenan como archivos Markdown legibles por humanos. Los artefactos de memoria en capas se encuentran en ~/.openclaw/memory-tdai/.

Memoria simbólica a corto plazo a través de Mermaid

Las tareas de agente de larga duración consumen tokens a través de registros detallados de herramientas, resultados de búsqueda, código y seguimiento de errores. TencentDB Agent Memory aborda esto mediante la descarga de contexto combinada con memoria simbólica.

Los registros completos de la herramienta se descargan en archivos externos en refs/*.md. Las transiciones de estado están codificadas en la sintaxis de Mermaid dentro de un lienzo de tareas liviano. El agente razona sobre el gráfico de símbolos en su ventana contextual.

Cuando necesita el texto sin formato, busca un node_id y recupera el archivo correspondiente. El equipo de desarrollo de Tencent describe esto como un determinista desglose desde el símbolo de la capa superior hasta el índice de la capa intermedia y el texto sin formato de la capa inferior.

Números de referencia

Los resultados se miden en sesiones continuas de largo horizonte, no en turnos aislados. SWE-bench, por ejemplo, ejecuta 50 tareas consecutivas por sesión para simular la presión de acumulación de contexto.

En WideSearch, la integración del complemento con OpenClaw aumenta la tasa de aprobación del 33% al 50%, una mejora relativa del 51,52%. El uso de tokens cae de 221,31 millones a 85,64 millones, una reducción del 61,38%.

En SWE-bench, el éxito aumenta del 58,4% al 64,2%, mientras que los tokens caen de 3474,1 millones a 2375,4 millones, una reducción del 33,09%. En AA-LCR, la tasa de éxito pasa del 44,0% al 47,5%. Los tokens caen de 112,0 millones a 77,3 millones, una reducción del 30,98%.

Para la memoria a largo plazo, la precisión de PersonaMem aumenta del 48% al 76%. Nota: estas cifras provienen de las propias evaluaciones de Tencent.

Recordar y recuperar

La recuperación por defecto es una estrategia híbrida. El sistema combina la búsqueda de palabras clave BM25 con incrustaciones de vectores, fusionadas mediante Reciprocal Rank Fusion (RRF). Los desarrolladores pueden cambiar al modo de palabra clave pura o de incrustación a través de un campo de configuración. El tokenizador BM25 admite chino (jieba) e inglés.

La configuración predeterminada activa una extracción de memoria L1 cada cinco turnos. Se genera una persona de usuario cada 50 nuevos recuerdos. La recuperación devuelve cinco elementos de forma predeterminada con un tiempo de espera de 5 segundos. Cuando se agota el tiempo de espera, el sistema omite la inyección en lugar de bloquear la conversación.

Superficie de instalación y revelador.

La integración de OpenClaw se envía como un único paquete npm: @tencentdb-agent-memory/memory-tencentdb. El proyecto requiere Node.js 22.16 o superior. Habilitarlo requiere un indicador de configuración. Luego, el complemento maneja la captura de conversaciones, la extracción de recuerdos, la agregación de escenas, la generación de personajes y la recuperación.

Para Hermes, una imagen de Docker incluye el agente, el complemento y TDAI Memory Gateway. El modelo predeterminado es DeepSeek-V3.2 de Tencent Cloud. Cualquier punto final compatible con OpenAI funciona a través del indicador MODEL_PROVIDER=custom.

Se exponen dos herramientas a los agentes durante una sesión: tdai_memory_search y tdai_conversation_search. Ambos devuelven referencias con los campos node_id y result_ref para seguimiento. También está disponible un backend de Tencent Cloud Vector Database (TCVDB) como alternativa al SQLite local.

Explicador visual de Marktechpost

Memoria del agente TencentDB: vista previa

01 / RESUMEN

¿Qué es la memoria del agente TencentDB?

Un sistema de memoria con licencia del MIT para agentes de IA que combina memoria simbólica a corto plazo con un canal de memoria a largo plazo de 4 niveles. Se ejecuta completamente local sin dependencias de API externas.

Memoria a corto plazo

Descarga registros detallados de herramientas en archivos y mantiene un lienzo compacto de tareas de Mermaid en contexto.

Memoria a largo plazo

Destila conversaciones en una pirámide semántica de 4 niveles: L0 → L1 → L2 → L3.

servidor local

El valor predeterminado es SQLite + sqlite-vec. La base de datos de vectores en la nube de Tencent (TCVDB) es opcional.

Integraciones

Se envía como un complemento de OpenClaw y una imagen de Hermes Agent Docker.

02 / ARQUITECTURA

La pirámide semántica de 4 niveles

La memoria a largo plazo tiene capas, no es plana. Las capas superiores llevan estructura; Las capas inferiores preservan la evidencia.

L3 · PersonaPerfil de usuario (persona.md)

L2 · EscenarioBloques de escena (Markdown)

L1 · ÁtomoDatos atómicos (JSONL)

L0 · ConversaciónDiálogo crudo

Ruta de acceso a detalles: Persona → Escenario → Átomo → Conversación. Las referencias utilizan node_id y result_ref para un rastreo determinista.

03 / CORTO PLAZO SIMBÓLICO

Lienzo de tarea de sirena + descarga de contexto

Los registros intermedios detallados son los mayores consumidores de tokens en tareas largas. El complemento los descarga en el disco y mantiene un gráfico de símbolos de alta densidad en contexto.

como funciona

Los registros completos de la herramienta se descargan en refs/*.md en el directorio de datos. Las transiciones de estado están codificadas en la sintaxis de Mermaid dentro de un lienzo de tareas liviano. El agente razona sobre el gráfico de símbolos y luego busca un node_id para extraer texto sin formato.

Ruta de almacenamiento en disco: ~/.openclaw/memory-tdai/. Todos los artefactos son legibles por humanos para la depuración de caja blanca.

04 / INSTALAR

Instale el complemento OpenClaw

Requiere Node.js 22.16 o superior y una instalación de OpenClaw.

Instalación de complementos de openclaw @tencentdb-agent-memory/memory-tencentdb reinicio de la puerta de enlace de openclaw

Habilitación de configuración cero

Agregue lo siguiente a ~/.openclaw/openclaw.json para activarlo con SQLite + sqlite-vec predeterminado.

{ “memory-tencentdb”: { “habilitado”: verdadero } }

05 / CONFIGURACIÓN

Parámetros de ajuste diario

Cada campo tiene un valor predeterminado sensato. Las perillas más comunes se enumeran a continuación.

FieldDefaultDescription storeBackendsqliteStorage backend retirada.strategyhybridkeyword/incrustación/híbrido (RRF) retirada.maxResults5Elementos devueltos por recuperación retirada.timeoutMs5000Omitir inyección en la tubería de tiempo de espera.cadaNConversations5Extracción L1 cada N vueltas persona.triggerEveryN50Generar persona cada N memorias descargadas.enabledfalseAlternar compresión a corto plazo

06 / COMPRESIÓN A CORTO PLAZO

Habilitar la descarga de Mermaid (v0.3.4+)

Tres pasos para activar la descarga de contexto para tareas a largo plazo.

Paso 1 · Habilite la descarga en la configuración del complemento

{ “memory-tencentdb”: { “config”: { “descarga”: { “enabled”: verdadero } } } }

Paso 2 · Registre la ranura para que OpenClaw enrute las solicitudes de descarga

{ “plugins”: { “slots”: { “contextEngine”: “openclaw-context-offload” } } }

Paso 3 · Aplique el parche de tiempo de ejecución (una vez por instalación de OpenClaw)

scripts bash/openclaw-after-tool-call-messages.patch.sh

07 / ACOPLADOR HERMES

Ejecute Hermes con memoria habilitada en un contenedor

Una única imagen de Docker incluye Hermes Agent, el complemento Memory_tencentdb y TDAI Memory Gateway.

docker build -f Dockerfile.hermes -t memoria-hermes. docker run -d \ –name hermes-memory \ –restart a menos que se detenga \ -p 8420:8420 \ -e MODEL_API_KEY=”su-clave-api” \ -e MODEL_BASE_URL=”https://api.lkeap.cloud.tencent.com/v1″ \ -e MODEL_NAME=”deepseek-v3.2″ \ -e MODEL_PROVIDER=”custom” \ -v hermes_data:/opt/data \ hermes-memory curl http://localhost:8420/health

Cualquier punto final compatible con OpenAI funciona a través de MODEL_PROVIDER=custom. Los datos de la memoria persisten en el volumen hermes_data.

08 / HERRAMIENTAS Y RECUPERACIÓN DEL AGENTE

Lo que ve el agente

Se exponen dos herramientas al agente durante una sesión. El retiro utiliza la fusión BM25 + vector + RRF de forma predeterminada.

tdai_memory_search

Busque en Átomos L1, Escenarios L2 y Persona L3.

tdai_conversación_búsqueda

Buscar historial de conversaciones L0 sin procesar.

Valores predeterminados de recuperación

Estrategia híbrida: palabra clave BM25 + incrustación de vectores, fusionada mediante Fusion de rango recíproco. El tokenizador BM25 admite chino (jieba) e inglés. Devuelve 5 artículos por retirada; tiempo de espera de 5000 ms; en el tiempo de espera se salta la inyección. Las referencias incluyen node_id y result_ref para rastreo.

09 / PUNTOS DE REFERENCIA

Ganancias reportadas con OpenClaw

Medido en sesiones continuas de largo horizonte, no en turnos aislados. SWE-bench ejecuta 50 tareas consecutivas por sesión.

BenchmarkBaselineCon complementoΔ PassΔ Tokens WideSearch33%50%+51,52%−61,38% SWE-bench58,4%64,2%+9,93%−33,09% AA-LCR44,0%47,5%+7,95%−30,98% PersonaMem48%76%+59%—

Las cifras provienen de las propias evaluaciones de Tencent y reflejan la integración con OpenClaw.

10 / RECURSOS

Adónde ir a continuación

Documentación, código fuente y canales comunitarios.

código fuente

github.com/Tencent/TencentDB-Agent-Memory

paquete npm

@tencentdb-agent-memoria/memoria-tencentdb

Hoja de ruta

Memoria portátil, generación automática de Skills, panel de depuración visual.

Comisariada por MARKTECHPOST · Investigación de IA, diseñada para constructores

Conclusiones clave

TencentDB Agent Memory es el sistema de memoria de código abierto (MIT) de Tencent para agentes de IA, construido sobre memoria simbólica a corto plazo junto con una canalización de memoria a largo plazo en capas sin dependencias de API externas. La memoria a largo plazo está estructurada como una pirámide semántica de 4 niveles (Conversación L0 → Átomo L1 → Escenario L2 → Persona L3), con desglose a través de node_id y result_ref en lugar de recuperación de vector plano. La memoria a corto plazo descarga registros detallados de herramientas a refs/*.md y mantiene solo un lienzo compacto de tareas de Mermaid en contexto, lo que reduce el uso de tokens y preserva la trazabilidad completa. Ganancias reportadas cuando se integra con OpenClaw: tasa de aprobación de WideSearch 33 % → 50 % con una reducción de token del 61,38 %, SWE-bench 58,4 % → 64,2 %, AA-LCR 44,0 % → 47,5 % y precisión de PersonaMem 48 % → 76 %. Se envía como un complemento npm único para OpenClaw y una imagen de Docker para Hermes, con SQLite local + sqlite-vec de forma predeterminada, recuperación híbrida BM25 + vector + RRF y un backend opcional de Tencent Cloud Vector Database (TCVDB).

Consulte el repositorio. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 150.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

¿Necesita asociarse con nosotros para promocionar su repositorio de GitHub O su página principal de Hugging O su lanzamiento de producto O seminario web, etc.? Conéctate con nosotros

Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias de Datos de la Universidad de Padua. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca en transformar conjuntos de datos complejos en conocimientos prácticos.