제로샷 러닝
제로샷 러닝은 AI 모델이 특정 작업에 대해 명시적으로 학습하지 않았더라도, 일반적인 지식과 추론 능력에 기반해 그 작업을 수행할 수 있는 능력입니다.
이해하기 제로샷 러닝
기존 머신러닝은 각 작업마다 레이블이 달린 데이터가 필요했습니다. 예를 들어 이메일을 분류하려면 수천 개의 분류된 이메일 예제가 있어야 했습니다. 제로샷 러닝은 이러한 제약을 깨뜨립니다. 방대한 텍스트 데이터로 학습한 대형 언어 모델은 새로운 작업 설명만으로도 일반적인 추론 능력을 발휘합니다. 즉, 모델에 각 카테고리가 무엇인지 설명만 해주면 본 적 없는 이메일 분류도 수행할 수 있습니다. 제로샷 기능은 모델의 규모가 커지면서 놀랍게 등장한 속성입니다. 작은 모델은 새로운 작업에 대해 몇 가지 예시(few-shot example)가 필요하지만, 충분히 큰 모델은 예시 없이도 작업 설명만으로 따라할 수 있습니다. 이 특성이 LLM(대형 언어 모델)이 매우 유용한 이유입니다. 새로운 작업에 데이터를 수집하고 레이블링할 필요 없이 바로 적용할 수 있기 때문입니다. 분류 작업에서는 모델이 후보 레이블과 입력의 적합도를 평가하여 제로샷 러닝이 활용됩니다. 생성 작업에서는 명확한 작업 지시 문구를 사용하는 방식입니다. 제로샷 성능의 품질은 작업 설명이 얼마나 잘 되어 있는지, 그리고 해당 작업이 모델의 학습 분포와 얼마나 유사한지에 크게 좌우됩니다. 제로샷 러닝은 인컨텍스트 러닝 및 지침 따르기와 밀접한 관련이 있습니다. 지침 기반 학습으로 추가 학습된 최신 LLM은 새로운 지시 사항도 신뢰성 있게 해석하고 수행할 수 있어 제로샷 작업에 특히 강점을 보입니다.
GAIA 활용 방법 제로샷 러닝
GAIA는 제로샷 러닝을 활용하여 이전에 경험해본 적 없는 자동화 요청도 처리합니다. 사용자가 자연어로 새로운 워크플로를 설명하면, GAIA의 대형 언어 모델이 작업 설명을 해석한 뒤 사전에 프로그래밍된 예시 없이도 적합한 작업 순서를 생성합니다. 이 덕분에 GAIA는 각 워크플로마다 별도의 훈련 없이도 사용자가 만드는 수많은 생산성 워크플로를 유연하게 지원할 수 있습니다.
관련 개념
퓨샷 러닝
퓨샷 러닝은 AI 모델이 가중치 업데이트 없이 프롬프트에 제공된 소수의 입력-출력 예제만으로 새로운 작업이나 출력 형식에 적응하는 능력을 의미합니다.
프롬프트 엔지니어링
프롬프트 엔지니어링은 원하는 결과를 신뢰성 있게 끌어내기 위해 AI 언어 모델에 입력을 설계하고 다듬는 실천으로, 기본 가중치 자체를 수정하지 않고도 모델의 행동을 조정할 수 있습니다.
대형 언어 모델 (LLM)
대형 언어 모델(LLM)은 방대한 텍스트 데이터셋으로 훈련되어, 다양한 작업에서 인간의 언어를 이해하고 생성하며 추론할 수 있는 딥러닝 모델입니다.
대형 언어 모델 (LLM)
대형 언어 모델(LLM)은 방대한 텍스트 데이터를 학습해 인간의 언어를 놀라울 정도로 자연스럽게 이해하고 생성하며 추론할 수 있는 인공지능 모델입니다.


