IA augmentée par la mémoire
L’IA augmentée par la mémoire est une architecture d’IA qui enrichit les capacités d’un modèle de langage en le reliant à des systèmes de mémoire persistante externes, permettant à l’agent de se souvenir et de retrouver des informations au-delà des limites d’une simple fenêtre de contexte.
Comprendre IA augmentée par la mémoire
Les modèles de langage sont par nature sans état : chaque inférence démarre à zéro, avec seulement ce qui est présent dans la fenêtre de contexte. L’augmentation de mémoire résout cette limitation en fournissant un stockage externe persistant dans lequel le modèle peut lire et écrire. Lorsque l’agent a besoin de contexte issu d’interactions passées, il récupère les souvenirs pertinents dans le stockage externe et les injecte dans le contexte actuel. Cela donne l’illusion d’une mémoire persistante tout en respectant les contraintes pratiques des fenêtres de contexte fixes. Les architectures d’augmentation de mémoire utilisent divers systèmes de stockage : des bases de données vectorielles pour la recherche sémantique, des bases de graphes pour la mémoire relationnelle, et des bases structurées pour la mémoire épisodique.
Comment GAIA utilise IA augmentée par la mémoire
GAIA est un système d’IA à mémoire augmentée. Son raisonnement LLM est renforcé par ChromaDB pour la mémoire sémantique, PostgreSQL pour une mémoire épisodique structurée, MongoDB pour une mémoire documentaire flexible et une mémoire basée sur des graphes pour le contexte relationnel. Cette architecture mémoire à plusieurs niveaux permet à GAIA de se souvenir des interactions passées, de comprendre le contexte des relations et de conserver des connaissances cohérentes à travers un nombre illimité de sessions.
Concepts liés
Mémoire d'agent
La mémoire d'agent est la capacité d'un agent IA à stocker, retrouver et utiliser des informations issues d'interactions, d'observations et d'actions passées pour orienter son comportement futur, assurant ainsi un contexte persistant entre les sessions.
Génération augmentée par récupération (RAG)
La Génération augmentée par récupération (RAG) est une technique qui améliore les réponses d'un LLM en récupérant d'abord des documents ou données pertinents à partir d'une base de connaissances externe et en injectant ce contexte dans l'invite du modèle.
Mémoire basée sur les graphes
La mémoire basée sur les graphes est une architecture de mémoire IA qui stocke les informations sous forme de nœuds interconnectés et de relations, permettant une compréhension contextuelle riche et une persistance des connaissances à travers les interactions.
Base de données vectorielle
Une base de données vectorielle est un système de base de données conçu pour stocker, indexer et interroger des embeddings vectoriels de haute dimension à grande échelle, permettant une recherche de similarité rapide sur de vastes ensembles de données embarquées.


