IA Aumentada por Memória
IA aumentada por memória é uma arquitetura de inteligência artificial que expande as capacidades de um modelo de linguagem conectando-o a sistemas externos de memória persistente, permitindo que o agente se lembre e recupere informações além dos limites de uma única janela de contexto.
Entendendo IA Aumentada por Memória
Modelos de linguagem são inerentemente sem estado: cada chamada de inferência começa do zero, apenas com o que está presente na janela de contexto. A ampliação de memória resolve essa limitação fornecendo um armazenamento externo persistente que o modelo pode ler e gravar. Quando o agente precisa de contexto de interações anteriores, ele recupera memórias relevantes do armazenamento externo e as insere no contexto atual. Isso cria o efeito de memória persistente, operando dentro dos limites práticos de janelas de contexto fixas. Arquiteturas de ampliação de memória utilizam diferentes tipos de armazenamento: bancos de dados vetoriais para recuperação semântica, bancos de dados em grafos para memória relacional e bancos de dados estruturados para registros episódicos.
Como GAIA usa IA Aumentada por Memória
GAIA é um sistema de IA com memória aumentada. Seu raciocínio LLM é aprimorado pelo ChromaDB para recuperação de memória semântica, PostgreSQL para memória episódica estruturada, MongoDB para memória flexível de documentos e memória baseada em grafos para contexto relacional. Essa arquitetura de memória em múltiplas camadas permite que a GAIA relembre interações passadas, compreenda o contexto dos relacionamentos e mantenha o conhecimento coerente ao longo de sessões ilimitadas.
Conceitos relacionados
Memória do Agente
Memória do agente é a capacidade de um agente de IA armazenar, recuperar e utilizar informações de interações, observações e ações anteriores para informar futuros comportamentos, possibilitando contexto persistente entre sessões.
Geração Aumentada por Recuperação (RAG)
Geração Aumentada por Recuperação (RAG) é uma técnica que aprimora as respostas de LLMs ao primeiro recuperar documentos ou dados relevantes de uma base de conhecimento externa e injetar esse contexto no prompt do modelo.
Memória Baseada em Grafo
Memória baseada em grafo é uma arquitetura de memória de IA que armazena informações como nós e relações interconectados, permitindo compreensão contextual rica e conhecimento persistente ao longo das interações.
Banco de Dados Vetorial
Um banco de dados vetorial é um sistema de banco de dados projetado para armazenar, indexar e consultar embeddings vetoriais de alta dimensão em escala, permitindo buscas rápidas por similaridade em grandes coleções de dados embutidos.


