Conozca EverOS: un tiempo de ejecución de memoria de agente Markdown de código abierto con recuperación de vectores híbrido BM25 + y habilidades de autoevolución

EverMind ha lanzado EverOS, un tiempo de ejecución de memoria de código abierto para agentes de IA. Se envía bajo una licencia Apache 2.0. Se dirige a un problema que los constructores de agentes encuentran temprano: los modelos de lenguaje grandes no tienen estado. La conversación termina y el contexto desaparece.

EverOS propone un sustrato diferente. En lugar de bloquear la memoria dentro de una base de datos vectorial, escribe la memoria como archivos Markdown simples. Esos archivos se convierten en la fuente de verdad que los agentes leen, editan y buscan en todas las sesiones.

TL;DR

EverOS almacena la memoria del agente como Markdown editable, indexado por SQLite y LanceDB. La recuperación híbrida combina BM25, búsqueda vectorial y filtrado escalar en una sola consulta. Los casos se resumen en habilidades reutilizables, lo que brinda a los agentes una memoria procedimental y de evolución propia. Las puntuaciones de referencia son sólidas, pero están informadas por EverMind; verifique en su propia carga de trabajo. Es de código abierto bajo Apache 2.0, con nube y paridad autohospedada.

¿Qué es EverOS?

EverOS es una biblioteca de Python y un tiempo de ejecución de memoria local. Se ejecuta como un servidor con una CLI y una API HTTP FastAPI, primero asíncrono en todo momento. Lo coloca en un bucle de agente existente en lugar de reconstruir su pila.

El diseño separa dos pistas de memoria. La memoria del lado del usuario contiene perfiles, episodios, hechos y previsiones. La memoria del lado del agente contiene casos y habilidades. Mantenerlos separados es inusual; la mayoría de las bibliotecas se centran únicamente en el historial de chat.

Cada registro llega como un archivo .md. Puedes abrirlo, editarlo, grep y versión Git, o verlo en Obsidian. EverAlgo, una biblioteca sin estado separada, maneja los algoritmos de extracción. EverOS organiza y persiste los resultados.

La pila de puntos finales es compatible con el protocolo OpenAI. Se conecta a OpenAI, OpenRouter, vLLM, Ollama o DeepInfra cambiando una URL base. Eso mantiene la integración cercana a un único cambio de configuración.

El tiempo de ejecución es primero local de forma predeterminada. Los datos nunca tienen que abandonar su entorno y cada capa es inspeccionable. Existe una opción administrada de EverOS Cloud para los equipos que prefieren no autohospedarse. Ambos comparten el mismo SDK, motor de recuperación y formato de memoria.

La arquitectura: Markdown, SQLite y LanceDB

EverOS utiliza una pila de almacenamiento de tres piezas. Markdown es la fuente de la verdad. SQLite gestiona el estado y las colas. LanceDB gestiona vectores, BM25 y filtros escalares.

Esto es deliberadamente más liviano que una configuración de memoria de producción típica. No se requieren MongoDB, Elasticsearch, Milvus, Redis o Kafka. Para desarrolladores individuales y equipos pequeños, esto reduce el costo operativo.

La recuperación es híbrida. Una única consulta de LanceDB combina concordancia de palabras clave BM25, búsqueda de vectores densos y filtrado escalar. EverMind comercializa esta ruta de recuperación multimodal como mRAG.

Una sincronización de índices en cascada mantiene alineados los archivos y los índices. La edición de un archivo .md activa un observador de archivos que vuelve a sincronizar el índice. La memoria permanece inspeccionable sin volverse obsoleta.

La recuperación también es ortogonal entre identificadores. Puede realizar una búsqueda por ID de usuario, ID de agente, ID de aplicación, ID de proyecto y ID de sesión. Ese alcance es importante en implementaciones de múltiples agentes y múltiples usuarios donde se requiere aislamiento de datos.

Cómo evoluciona la memoria: los casos se convierten en habilidades

Una característica distintiva es la memoria procesal. EverOS registra cada tarea de agente completada como un Caso. Los patrones exitosos repetidos se resumen fuera de línea en habilidades reutilizables.

Ésta es la afirmación de la “autoevolución”, expresada claramente. Las habilidades se comparten entre un equipo de agentes, sin selección manual ni codificación. El objetivo son agentes que mejoren con el uso en lugar de reiniciar cada sesión.

La versión 1.1.0 agregó más maquinaria de ciclo de vida. Introdujo API de conocimiento para páginas Markdown respaldadas por código fuente con taxonomía y búsqueda de temas. También agregó Reflection, un proceso fuera de línea que fusiona grupos de episodios y refina perfiles y habilidades entre sesiones.

El modelo de memoria es simple. La memoria episódica responde a “lo que pasó”. La memoria del perfil responde “quién es este usuario”. La memoria procedimental responde ‘cómo se hace esta tarea’.

Punto de referencia

El equipo de EverMind informa un 93,05 % en LoCoMo, un 83,00 % en LongMemEval y un 93,04 % en HaluMem. También cita una latencia de recuperación de p95 inferior a 500 ms. LoCoMo y LongMemEval miden la memoria conversacional a largo plazo; HaluMem apunta a las alucinaciones de memoria. Estos números provienen de publicaciones de EverMind.

La siguiente tabla compara EverOS con alternativas comunes en dimensiones de diseño concretas:

DimensiónEverOSRag ingenuoVentana de contexto completaOtras bibliotecas de memoriaFuente de la verdadArchivos .md de Plain MarkdownRegistros de base de datos vectorialesSolo avisoEstado de API o base de datosPila localMarkdown + SQLite + LanceDBVector DB + código de aplicación NingunoServicios administrados a menudo RecuperaciónHíbrido BM25 + vector + escalarSolo vector denso Ninguno (sin recuperación)VaríaMemoria de procedimientoCasos destilados en Habilidades Ninguna Ninguna Rara Ingesta multimodal PDF, imagen, Office, URL en una llamada Canalización manual Solo a través del contexto Precisión parcial de LoCoMo 93,05 % (informado por EverMind): N/A (límite de contexto) Varía Licencia Apache 2.0 Varía N/AVaria / propietario

Casos de uso, con ejemplos reales

La biblioteca enlaza con integraciones de trabajo. Muestran lo que permite la memoria persistente en productos reales.

Hive Orchestrator es un Hive-mind nativo del navegador para agentes de codificación CLI. Claude Code, Codex, Gemini y OpenCode colaboran como procesos PTY reales a través de un protocolo de equipo compartido.

Reunite utiliza memoria semántica para la búsqueda de valor público. Los padres describen lo que recuerdan, los niños describen lo que recuerdan y el sistema muestra conexiones.

Otros ejemplos abarcan la atención sanitaria y el hardware. Incluyen un asistente de memoria para el Alzheimer y un dispositivo portátil con IA. El wearable escucha la vida cotidiana y la convierte en memoria. Entre los ejemplos también se encuentra un compañero de estudio con memoria que evoluciona por sí misma. El ecosistema más amplio agrega un complemento Claude Code y una capa de memoria basada en MCP para asistentes de codificación.

Un tutorial de código de cinco minutos

La instalación utiliza herramientas estándar de Python. EverOS requiere Python 3.12 o posterior. La demostración local no necesita claves API.

# Requiere Python 3.12+ uv pip install everos # o: pip install everos everos demo # visualizador educativo local, sin claves everos init # pega las claves OpenRouter + DeepInfra en .env everos server start # inicia el curl del servidor FastAPI http://127.0.0.1:8000/health # -> {“status”:”ok”}

Agregar y buscar memoria son simples llamadas HTTP. El siguiente ejemplo almacena un hecho, fuerza su extracción y luego lo recupera.

# 1) Agregue una conversación corta curl -X POST http://127.0.0.1:8000/api/v1/memory/add \ -H ‘Content-Type: application/json’ \ -d ‘{“session_id”:”demo-001″,”app_id”:”default”,”project_id”:”default”, “messages”:[{“sender_id”:”alice”,”role”:”user”,”timestamp”:1750000000000,
“content”:”I love climbing in Yosemite every spring.”}]}’ # 2) Vaciar para forzar la extracción (demostración local) curl -X POST http://127.0.0.1:8000/api/v1/memory/flush \ -H ‘Content-Type: application/json’ \ -d ‘{“session_id”:”demo-001″,”app_id”:”default”,”project_id”:”default”}’ # 3) Buscar en curl -X POST http://127.0.0.1:8000/api/v1/memory/search \ -H ‘Tipo de contenido: aplicación/json’ \ -d ‘{“user_id”:”alice”,”app_id”:”default”,”project_id”:”default”, “query”:”¿Dónde me gusta escalar?”,”top_k”:5}’

La ingestión multimodal es un extra opcional. Instalación de everos[multimodal] agrega análisis de imágenes, archivos PDF y audio. Los documentos de Office también requieren LibreOffice, que convierte los archivos a PDF antes de analizarlos.

Pruébelo: demostración de memoria interactiva

La demostración integrada a continuación simula el bucle de EverOS en su navegador. Agregue un fragmento, observe cómo se extrae y etiqueta y luego búsquelo mediante la recuperación híbrida. Es ilustrativo y no se conecta a un servidor en vivo.