Cómo maximizar la memoria agente para el aprendizaje continuo

Modelos capaces de automatizar una variedad de tareas, como la investigación y la codificación. Sin embargo, muchas veces trabaja con un LLM, completa una tarea y la próxima vez que interactúa con el LLM, comienza desde cero.

Este es un problema importante cuando se trabaja con LLM. Perdemos mucho tiempo simplemente repitiendo instrucciones a los LLM, como el formato de código deseado o cómo realizar tareas según sus preferencias.

Aquí es donde entran los archivos agentes.md: una forma de aplicar el aprendizaje continuo a los LLM, donde el LLM aprende sus patrones y comportamientos almacenando información generalizable en un archivo separado. Luego, este archivo se lee cada vez que inicia una nueva tarea, lo que evita el problema del arranque en frío y le ayuda a evitar la repetición de instrucciones.

En este artículo, proporcionaré una descripción general de alto nivel de cómo logro un aprendizaje continuo con LLM actualizando continuamente el archivo agentes.md.

En este artículo, aprenderá cómo aplicar el aprendizaje continuo a los LLM. Imagen de Géminis.

¿Por qué necesitamos un aprendizaje continuo?

Comenzar con un contexto de agente nuevo lleva tiempo. El agente debe captar sus preferencias y usted debe dedicar más tiempo a interactuar con el agente para lograr que haga exactamente lo que usted desea.

Por ejemplo:

Decirle al agente que use la sintaxis de Python 3.13, en lugar de 3.12. Informar al agente que siempre use tipos de retorno en las funciones. Garantizar que el agente nunca use el tipo Cualquier.

A menudo tuve que decirle explícitamente al agente que usara la sintaxis Python 3.13 y no la sintaxis 3.12, probablemente porque la sintaxis 3.12 es más frecuente en su conjunto de datos de entrenamiento.

El objetivo de utilizar agentes de IA es ser rápido. Por lo tanto, no querrá perder tiempo repitiendo instrucciones sobre qué versión de Python usar, o que el agente nunca debería usar el tipo Any.

Además, el agente de IA a veces dedica más tiempo a descubrir información que ya tiene disponible, por ejemplo:

El nombre de su tabla de documentos Los nombres de sus registros de CloudWatch Los prefijos en sus depósitos de S3

Si el agente no conoce el nombre de su tabla de documentos, debe:

Enumerar todas las tablas Encuentre una tabla que suene como la tabla de documentos (podrían haber varias opciones potenciales). Haga una búsqueda en la tabla para confirmar o pregunte al usuario.

Memoria agente — Esta imagen representa lo que tiene que hacer un agente para encontrar el nombre de su tabla de documentos. Primero, debe enumerar todas las tablas de la base de datos y luego buscar los nombres de las tablas relevantes. Por último, el agente debe confirmar que tiene la tabla correcta solicitando confirmación al usuario o realizando una búsqueda en la tabla. Esto lleva mucho tiempo. En lugar de esto, puede almacenar el nombre de la tabla de documentos en agentes.md y ser mucho más efectivo con su agente codificador en futuras interacciones. Imagen de Géminis.

Esto lleva mucho tiempo y es algo que podemos evitar fácilmente agregando el nombre de la tabla de documentos, los registros de CloudWatch y los prefijos del depósito S3 en agentes.md.

Por lo tanto, la razón principal por la que necesitamos un aprendizaje continuo es que repetir instrucciones es frustrante y requiere mucho tiempo, y cuando trabajamos con agentes de IA, queremos ser lo más efectivos posible.

Cómo aplicar el aprendizaje continuo

Hay dos formas principales en las que abordo el aprendizaje continuo, y ambas implican un uso intensivo del archivo agentes.md, que debería tener en cada repositorio en el que esté trabajando:

Cada vez que el agente comete un error, le informo cómo corregir el error y lo recuerdo para más adelante en el archivo agent.md. Después de cada hilo que he tenido con el agente, uso el siguiente mensaje. Esto garantiza que todo lo que le dije al agente a lo largo del hilo, o la información que descubrió a lo largo del hilo, se almacene para su uso posterior. Esto hace que las interacciones posteriores sean mucho más efectivas. Generalice el conocimiento de este hilo y recuérdelo para más adelante. Cualquier cosa que pueda ser útil saber para una interacción posterior, al hacer cosas similares. Almacenar en agentes.md

La aplicación de estos dos conceptos simples le permitirá avanzar en un 80 % hacia el aprendizaje continuo con los LLM y le convertirá en un ingeniero mucho más eficaz.

El punto más importante es mantener siempre la memoria agente teniendo en cuenta a los agentes.md. Siempre que el agente haga algo que no te guste, siempre debes recordar guardarlo en agentes.md

Podría pensar que corre el riesgo de inflar el archivo agentes.md, lo que hará que el agente sea más lento y más costoso. Sin embargo, este no es realmente el caso. Los LLM son extremadamente buenos para condensar información en un archivo. Además, incluso si tiene un archivo agentes.md que consta de miles de palabras, no es realmente un problema, ni en lo que respecta a la longitud del contexto ni al costo.

La longitud del contexto de los LLM de frontera es de cientos de miles de tokens, por lo que no hay ningún problema. Y por el costo, probablemente comenzará a ver que el costo de usar el LLM disminuye. La razón de esto es que el agente gastará menos tokens en descifrar información, porque esa información ya está presente en agentes.md.

El uso intensivo de agentes.md para la memoria agente hará que el uso de LLM sea más rápido y reducirá los costos.

Algunos consejos adicionales

También me gustaría agregar algunos consejos adicionales que son útiles cuando se trata de memoria agente.

El primer consejo es que al interactuar con Claude Code, puedes acceder a la memoria del agente usando “#” y luego escribir lo que deseas recordar. Por ejemplo, escriba esto en la terminal cuando interactúe con Claude Code:

# Utilice siempre la sintaxis Python 3.13, evite la sintaxis 3.12

Luego obtendrá una opción, como ve en la imagen a continuación. O lo guarda en la memoria del usuario, que almacena la información de todas sus interacciones con Claude Code, sin importar el repositorio de código. Esto es útil para información genérica, como tener siempre un tipo de retorno para funciones.

La segunda y tercera opción son guardarlo en la carpeta actual en la que se encuentra o en la carpeta raíz de su proyecto. Esto puede resultar útil para almacenar información específica de una carpeta, por ejemplo, para describir únicamente un servicio específico. O para almacenar información sobre un repositorio de código en general.

Opciones de memoria del código Claude — Esta imagen resalta las diferentes opciones de memoria que tienes con Claude. Puede guardar en la memoria del usuario y almacenar la memoria en todas sus sesiones, sin importar el repositorio. Además, puedes almacenarlo en una subcarpeta del proyecto en el que te encuentres, por ejemplo, si quieres almacenar información sobre un servicio específico. Por último, también puede almacenar la memoria en la carpeta raíz del proyecto, de modo que todo el trabajo con el repositorio tendrá el contexto. Imagen del autor.

Además, diferentes agentes de codificación utilizan diferentes archivos de memoria.

Claude Code usa CLAUDE.md Warp usa WARP.md Cursor usa .cursorrules

Sin embargo, todos los agentes suelen leer agentes.md, por lo que recomiendo almacenar información en ese archivo, para que tenga acceso a la memoria del agente sin importar qué agente de codificación esté utilizando. Esto se debe a que algún día Claude Code será el mejor, pero es posible que otro día veamos a otro agente de codificación en la cima.

AGI y aprendizaje continuo

También me gustaría agregar una nota sobre AGI y el aprendizaje continuo. A veces se dice que el verdadero aprendizaje continuo es uno de los últimos obstáculos para lograr el AGI.

Actualmente, los LLM esencialmente fingen el aprendizaje continuo simplemente almacenando lo que aprenden en archivos que leen más adelante (como agentes.md). Sin embargo, lo ideal sería que los LLM actualicen continuamente los pesos de sus modelos cada vez que aprendan nueva información, esencialmente de la misma manera que los humanos aprenden los instintos.

Desafortunadamente, todavía no se ha logrado un verdadero aprendizaje continuo, pero es probable que sea una capacidad que veremos más en los próximos años.

Conclusión

En este artículo, hablé sobre cómo convertirse en un ingeniero mucho más eficaz utilizando agentes.md para el aprendizaje continuo. Con esto, su agente se dará cuenta de sus hábitos, los errores que comete, la información que utiliza habitualmente y muchos otros datos útiles. Nuevamente, esto hará que las interacciones posteriores con su agente sean mucho más efectivas. Creo que el uso intensivo del archivo agentes.md es esencial para convertirse en un buen ingeniero y es algo que debe esforzarse por lograr constantemente.

👉 Mis recursos gratuitos

🚀 10 veces su ingeniería con LLM (curso gratuito por correo electrónico de 3 días)

📚 Obtenga mi libro electrónico gratuito sobre Modelos de lenguaje de visión

💻 Mi seminario web sobre modelos de lenguaje de visión

👉 Encuéntrame en las redes sociales:

📩 Suscríbete a mi newsletter

🧑‍💻 Ponte en contacto

🔗 LinkedIn

🐦X/Twitter

✍️ Medio

Cómo maximizar la memoria agente para el aprendizaje continuo

ByEquipo de 7 minutos

¿Por qué necesitamos un aprendizaje continuo?

Cómo aplicar el aprendizaje continuo

Algunos consejos adicionales

AGI y aprendizaje continuo

Conclusión

By Equipo de 7 minutos

Related Post

Skyfall AI lanza MORPHEUS: un punto de referencia de simulación empresarial persistente que hace necesario el aprendizaje por refuerzo continuo bajo una estructura no estacionaria

Mistral Vibe para Code vs Claude Code vs Cursor vs Codex: cuatro agentes puntuados en una tarea de andamio a relaciones públicas

Google lanza LiteRT.js: un enlace JavaScript de LiteRT que ejecuta modelos .tflite en navegadores a través de WebGPU

You missed

Si Andy Burnham se convierte en primer ministro, las personas con discapacidad esperan más que promesas

Décadas de negligencia están alimentando el próximo incendio forestal « Euro Weekly News

El juicio de Lil Durk da un giro importante mientras los fanáticos comparten reacciones encontradas

¡Mira cómo arde Arquímedes! Rocket Lab enciende el motor de su potente lanzador de neutrones de próxima generación (vídeo)