벡터 임베딩
벡터 임베딩은 텍스트, 이미지 등 다양한 데이터를 의미를 반영한 수치로 표현하여, 기계가 정보 간 유사성과 관계를 이해할 수 있게 하는 기법입니다.
이해하기 벡터 임베딩
텍스트가 벡터 임베딩으로 변환되면, 그 의미가 수백~수천 차원의 숫자 목록으로 인코딩됩니다. 유사한 개념일수록 이 숫자 공간에서 더 가까이 위치합니다. 예를 들어 '회의 일정 잡기'라는 문장은 '통화 예약하기'와는 가깝고, '장보기'와는 멀리 떨어집니다. 이런 특성 때문에 벡터 임베딩은 의미 기반 검색에 필수적이며, 단순 키워드 일치 대신 의미로 정보를 찾게 해줍니다. 벡터 데이터베이스는 이러한 임베딩을 저장하고 수백만 개 데이터를 빠르게 유사도 검색할 수 있게 합니다.
GAIA 활용 방법 벡터 임베딩
GAIA는 임베딩을 저장하기 위해 벡터 데이터베이스인 ChromaDB를 사용합니다. 사용자의 이메일, 작업, 노트, 그리고 문서의 임베딩을 저장하고, 정보를 찾거나 에이전트가 작업의 맥락이 필요할 때 내장된 데이터 전체를 시맨틱 검색합니다. 예를 들어 'Q3 예산 검토에 관한 이메일 찾아줘'라고 요청하면 이메일 제목이 '재무 계획 논의'여도 GAIA가 해당 내용을 찾아냅니다. 시맨틱 이해는 단순한 키워드 일치를 넘어서 작동합니다.
관련 개념
의미 기반 검색
의미 기반 검색은 검색 쿼리의 의미와 의도를 이해하여, 단순히 키워드 일치가 아닌 개념 상의 연관성에 따라 결과를 제공하는 검색 기술입니다.
그래프 기반 메모리
그래프 기반 메모리는 정보를 서로 연결된 노드와 관계로 저장하여, 상호작용 전반에 걸쳐 풍부한 맥락 이해와 지속적인 지식 유지를 가능하게 하는 AI 메모리 아키텍처입니다.
지식 그래프
지식 그래프는 정보를 엔터티, 그 속성, 그리고 이들 간의 관계로 구조화하여, 기계가 연결된 정보를 이해하고 추론할 수 있게 하는 데이터 구조입니다.
대형 언어 모델 (LLM)
대형 언어 모델(LLM)은 방대한 텍스트 데이터를 학습해 인간의 언어를 놀라울 정도로 자연스럽게 이해하고 생성하며 추론할 수 있는 인공지능 모델입니다.


