IA Aumentada con Memoria
La IA aumentada con memoria es una arquitectura de inteligencia artificial que amplía las capacidades de un modelo de lenguaje conectándolo a sistemas de memoria externa persistente, permitiendo que el agente recuerde y recupere información más allá de los límites de una sola ventana de contexto.
Comprendiendo IA Aumentada con Memoria
Los modelos de lenguaje son inherentemente sin estado: cada llamada de inferencia comienza desde cero con solo lo que está en la ventana de contexto. La ampliación de memoria resuelve esta limitación proporcionando un almacenamiento externo persistente del que el modelo puede leer y escribir. Cuando el agente necesita contexto de interacciones pasadas, recupera los recuerdos relevantes del almacenamiento externo y los inyecta en el contexto actual. Esto logra el efecto de una memoria persistente, respetando las limitaciones prácticas de las ventanas de contexto fijas. Las arquitecturas de ampliación de memoria utilizan varios tipos de almacenamiento: bases de datos vectoriales para recuperación semántica, bases de datos gráficas para memoria relacional y bases de datos estructuradas para registros episódicos.
Cómo GAIA usa IA Aumentada con Memoria
GAIA es un sistema de IA aumentada con memoria. Su razonamiento LLM se complementa con ChromaDB para la recuperación semántica de memoria, PostgreSQL para memoria episódica estructurada, MongoDB para documentos y memoria flexible, y memoria basada en grafos para el contexto relacional. Esta arquitectura de memoria multinivel permite a GAIA recordar interacciones pasadas, comprender relaciones y mantener conocimientos coherentes a lo largo de sesiones ilimitadas.
Conceptos relacionados
Memoria del agente
La memoria del agente es la capacidad de un agente de IA para almacenar, recuperar y utilizar información de interacciones, observaciones y acciones pasadas para informar su comportamiento futuro, permitiendo un contexto persistente a lo largo de sesiones.
Generación Aumentada por Recuperación (RAG)
La Generación Aumentada por Recuperación (RAG) es una técnica que mejora las respuestas de LLM recuperando primero documentos o datos relevantes de una base de conocimiento externa e inyectando ese contexto en el prompt del modelo.
Memoria basada en gráficos
La memoria basada en gráficos es una arquitectura de memoria de IA que almacena información como nodos y relaciones interconectados, permitiendo una comprensión contextual amplia y conocimiento persistente a lo largo de las interacciones.
Base de datos vectorial
Una base de datos vectorial es un sistema de base de datos diseñado para almacenar, indexar y consultar embeddings vectoriales de alta dimensión a gran escala, permitiendo búsquedas de similitud rápidas en grandes colecciones de datos embebidos.


