EngineeringMay 21, 202610 min read

La memoria no es una base de datos.

El error más común en diseño multi-agente es tratar la memoria del agente como una base de datos — guardar todo, recuperar por query. Una base de datos recuerda perfecto y no olvida nada, y esa es exactamente la forma equivocada para una mente. Así construimos la memoria de agentes en GOGOGO: episódica vs semántica, por qué olvidar es una feature, y el modelo de cuatro capas que usamos.

Atakan Özalan

Cofundador & lead de ingeniería, GOGOGO LLC

Acá está el error de arquitectura más común que veo en sistemas multi-agente, incluido en nuestro propio trabajo temprano en GOGOGO LLC: tratar la memoria de un agente como una base de datos. Guardar cada interacción. Indexarla. En el próximo turno, recuperar por similitud. Llamarlo memoria. Lanzarlo.

Se siente correcto porque una base de datos y una memoria las dos 'guardan cosas que podés recuperar después'. Pero una base de datos está construida para recordar perfecto y no olvidar nada — y esa es precisamente la forma equivocada para una mente. Un sistema que recuerda todo por igual no tiene memoria; tiene un log. Este post es cómo construimos de verdad la memoria de agentes, y por qué la mayor parte del trabajo es decidir qué tirar.

Lo que hace una base de datos que una memoria no debe hacer

Una base de datos tiene cuatro propiedades que son virtudes para el almacenamiento y defectos para la cognición. Es completa — cada fila que escribiste sigue ahí. Es plana — una fila de hace un año es tan recuperable como una de hace un segundo. Es literal — guarda lo que pasó, no lo que significó. Y es consultada — nada aflora salvo que lo pidas con precisión.

Una mente es lo opuesto en las cuatro. Es con pérdida — la mayoría de lo que viviste hoy ya se fue, a propósito. Es graduada — lo reciente e importante suena fuerte, lo viejo y trivial suena tenue. Es interpretada — recordás el significado de una conversación mucho después de las palabras. Y es asociativa — los recuerdos afloran sin pedirlo porque el momento actual se les parece. Un agente que necesita comportarse como si tuviera mente no llega ahí consultando una tabla. El comportamiento que querés está en las cuatro cosas que la base de datos se niega a hacer.

Las cuatro capas que de verdad construimos

Nuestra memoria de agente no es un store. Son cuatro, cada uno con un tiempo de vida distinto y un trabajo distinto.

1 · Memoria de trabajo — la corrida actual

Lo que el agente está sosteniendo ahora mismo: la tarea, los últimos pasos, el contexto inmediato. Es chica, rápida, y se descarta deliberadamente cuando termina la corrida. La memoria de trabajo no se persiste porque persistirla es cómo envenenás la próxima corrida con el ruido de la anterior. La mayoría de los bugs de 'el agente se confundió' son memoria de trabajo que debió descartarse y no se descartó.

2 · Memoria episódica — qué pasó

Un registro de corridas pasadas específicas: este cliente preguntó esto, el sistema hizo aquello, la calificación fue esta. La memoria episódica sí se parece a una base de datos — pero la parte crítica es que decae. Un episodio lleva un puntaje de saliencia; los episodios comunes se desvanecen y se podan, los sorprendentes o de alta consecuencia se conservan. No guardamos cada episodio. Guardamos los que vale la pena aprender.

3 · Memoria semántica — qué significa

Esta es la capa que los equipos saltan, y es la que más importa. La memoria semántica no son eventos — es el significado destilado de muchos eventos. 'Este cliente prefiere respuestas concisas.' 'Las facturas de este proveedor siempre necesitan corregir el campo de impuestos.' La produce un proceso en segundo plano que lee la memoria episódica y escribe hechos. La memoria semántica es chica, durable y legible por humanos. Es lo que hace que un agente se sienta como que te conoce en vez de como que te buscó.

4 · Memoria procedimental — qué funciona

La capa más lenta y más valiosa: procedimiento aprendido. 'Para esta clase de tarea, esta secuencia de agentes en este orden produce la mejor calificación.' La memoria procedimental es cómo un sistema multi-agente mejora en su trabajo con el tiempo sin que un humano lo re-ajuste. Cambia rara vez y solo con evidencia fuerte — es la habilidad ganada con esfuerzo del sistema, no sus apuntes.

Olvidar es la feature

Todo lo de arriba tiene decaimiento incorporado, y eso es el diseño, no una limitación por la que pedimos disculpas. Un agente que no puede olvidar tiene tres modos de fallo, y caímos en los tres antes de entender esto.

Se vuelve lento. Cada turno recupera contra un store que no para de crecer. El agente que era ágil con 100 episodios está pesado con 100.000.
Se confunde. Hechos viejos y hechos actuales conviven con igual peso. El agente cita algo que era cierto hace seis meses y hoy está mal, porque la base de datos nunca le dijo que el hecho había envejecido.
Se vuelve siniestro. Un agente que aflora algo que el usuario mencionó una vez, al pasar, hace un año, no se siente inteligente. Se siente como vigilancia. Olvidar con gracia también es una cortesía.

Así que puntuamos cada memoria por saliencia y dejamos morir las de baja saliencia. Olvidar no es pérdida de datos. Es el acto que convierte un log en una memoria — y el instinto de diseño acá es el mismo del que escribí en construir mundos de agentes con cuidado: sos responsable de la forma de la mente que construís.

“Una base de datos se juzga por lo que nunca pierde. Una memoria se juzga por lo que suelta correctamente. Si tu agente no olvida nada, no le diste una memoria — le diste un acopio, y un acopio se vuelve más pesado y menos útil cada día que pasa.”

Cómo empezar

Si tu agente hoy tiene un único vector store indiferenciado, no reconstruyas todo. Hacé esto en orden. Primero, separá la memoria de trabajo y asegurate de que se descarte al fin de corrida — esto solo arregla una cantidad sorprendente de bugs de 'agente confundido'. Segundo, agregá un puntaje de saliencia a los episodios guardados y un job que pode la cola baja; ahora tu store deja de crecer sin límite. Tercero, agregá la pasada de destilación semántica — el proceso en segundo plano que convierte episodios en unos pocos hechos durables y legibles. La memoria procedimental viene última, una vez que tenés calificaciones de las cuales aprender. Una capa a la vez, y notá que tres de los cuatro pasos son sobre remover cosas. Eso no es incidental. Eso es lo que la memoria es. Más de cómo pienso en atakanozalan.com.