퓨샷 러닝
퓨샷 러닝은 AI 모델이 가중치 업데이트 없이 프롬프트에 제공된 소수의 입력-출력 예제만으로 새로운 작업이나 출력 형식에 적응하는 능력을 의미합니다.
이해하기 퓨샷 러닝
퓨샷 러닝은 대형 언어 모델이 지닌 가장 실용적인 성질 중 하나입니다. 원하는 입력-출력 예시 몇 개만 프롬프트에 넣으면, 모델이 특정 출력 형식, 스타일, 혹은 추론 패턴으로 신뢰성 있게 유도됩니다. 이런 특징 때문에 이 방식을 인컨텍스트 러닝(in-context learning)이라고도 부르는데, 학습이 경사 하강법을 통한 가중치 업데이트가 아니라 맥락 창(context window) 내부에서 일어나기 때문입니다. 예를 들어, 이메일에서 과제 정보를 추출하는 예시 세 개를 보여주면, 새롭게 표현된 이메일일지라도 모델이 일관성 있게 과제를 추출하는 법을 배울 수 있습니다. 이는 전통적인 지도학습이 수천 개의 레이블된 데이터가 필요한 것과 비교해 훨씬 효율적입니다. 퓨샷 프롬프팅은 특히 구조화된 결과가 필요한 작업(비정형 텍스트에서 특정 필드 추출, 설명을 JSON 객체로 변환, 항목을 카테고리로 분류 등)에 강력합니다. 예시를 통해 기대하는 결과 형식과 판단 기준을 암묵적으로 정의할 수 있습니다. 필요한 예시의 수는 작업과 모델마다 다를 수 있습니다. 예제가 많을수록 일관성이 높아지지만, 맥락 창의 용량도 더 많이 차지합니다. 복잡한 추출 작업에서는 보통 세 개에서 열 개 사이의 예시가 적절하며, 연쇄적 사고(chain-of-thought) 퓨샷 러닝처럼 예시 속에 추론 과정을 포함시키면 복잡한 추론 과제에서도 성능이 오릅니다.
GAIA 활용 방법 퓨샷 러닝
GAIA는 이메일에서 작업 세부 정보 추출, 자연어에서 캘린더 일정 정보 파싱, 메시지 긴급도 분류 등 일관된 구조의 결과가 필요한 작업의 프롬프트에 퓨샷 예시를 사용합니다. 대표적인 예시를 제시함으로써, GAIA의 프롬프트는 LLM이 하위 처리 및 도구 실행에 필요한 정확한 형식으로 데이터를 반환하도록 보장합니다.
관련 개념
제로샷 러닝
제로샷 러닝은 AI 모델이 특정 작업에 대해 명시적으로 학습하지 않았더라도, 일반적인 지식과 추론 능력에 기반해 그 작업을 수행할 수 있는 능력입니다.
프롬프트 엔지니어링
프롬프트 엔지니어링은 원하는 결과를 신뢰성 있게 끌어내기 위해 AI 언어 모델에 입력을 설계하고 다듬는 실천으로, 기본 가중치 자체를 수정하지 않고도 모델의 행동을 조정할 수 있습니다.
대형 언어 모델 (LLM)
대형 언어 모델(LLM)은 방대한 텍스트 데이터셋으로 훈련되어, 다양한 작업에서 인간의 언어를 이해하고 생성하며 추론할 수 있는 딥러닝 모델입니다.
체인 오브 쏫 추론
체인 오브 쏫(CoT) 추론은 AI 모델이 최종 답변을 내기 전에 중간 추론 과정을 명확히 서술하게 하는 프롬프트 기법으로, 복잡한 다단계 문제의 정확도를 획기적으로 높여줍니다.


