제로샷 러닝은 항상 잘 동작하나요?

항상 완벽하지는 않습니다. 매우 전문적인 작업, 모호한 지시, 또는 모델의 학습 데이터와 크게 다른 작업에는 제로샷 성능이 떨어질 수 있습니다. 예시(퓨샷)를 추가하거나 작업을 더 작은 단계로 나누는(연쇄적 사고, Chain-of-Thought) 방식이 복잡한 상황에서 결과를 개선하는 데 도움이 됩니다.

제로샷 러닝

제로샷 러닝은 AI 모델이 특정 작업에 대해 명시적으로 학습하지 않았더라도, 일반적인 지식과 추론 능력에 기반해 그 작업을 수행할 수 있는 능력입니다.

이해하기 제로샷 러닝

기존 머신러닝은 각 작업마다 레이블이 달린 데이터가 필요했습니다. 예를 들어 이메일을 분류하려면 수천 개의 분류된 이메일 예제가 있어야 했습니다. 제로샷 러닝은 이러한 제약을 깨뜨립니다. 방대한 텍스트 데이터로 학습한 대형 언어 모델은 새로운 작업 설명만으로도 일반적인 추론 능력을 발휘합니다. 즉, 모델에 각 카테고리가 무엇인지 설명만 해주면 본 적 없는 이메일 분류도 수행할 수 있습니다. 제로샷 기능은 모델의 규모가 커지면서 놀랍게 등장한 속성입니다. 작은 모델은 새로운 작업에 대해 몇 가지 예시(few-shot example)가 필요하지만, 충분히 큰 모델은 예시 없이도 작업 설명만으로 따라할 수 있습니다. 이 특성이 LLM(대형 언어 모델)이 매우 유용한 이유입니다. 새로운 작업에 데이터를 수집하고 레이블링할 필요 없이 바로 적용할 수 있기 때문입니다. 분류 작업에서는 모델이 후보 레이블과 입력의 적합도를 평가하여 제로샷 러닝이 활용됩니다. 생성 작업에서는 명확한 작업 지시 문구를 사용하는 방식입니다. 제로샷 성능의 품질은 작업 설명이 얼마나 잘 되어 있는지, 그리고 해당 작업이 모델의 학습 분포와 얼마나 유사한지에 크게 좌우됩니다. 제로샷 러닝은 인컨텍스트 러닝 및 지침 따르기와 밀접한 관련이 있습니다. 지침 기반 학습으로 추가 학습된 최신 LLM은 새로운 지시 사항도 신뢰성 있게 해석하고 수행할 수 있어 제로샷 작업에 특히 강점을 보입니다.

GAIA 활용 방법 제로샷 러닝

GAIA는 제로샷 러닝을 활용하여 이전에 경험해본 적 없는 자동화 요청도 처리합니다. 사용자가 자연어로 새로운 워크플로를 설명하면, GAIA의 대형 언어 모델이 작업 설명을 해석한 뒤 사전에 프로그래밍된 예시 없이도 적합한 작업 순서를 생성합니다. 이 덕분에 GAIA는 각 워크플로마다 별도의 훈련 없이도 사용자가 만드는 수많은 생산성 워크플로를 유연하게 지원할 수 있습니다.

자주 묻는 질문

제로샷 러닝은 예시가 전혀 필요하지 않습니다. 모델이 작업 설명만을 바탕으로 추론합니다. 반면, 퓨샷 러닝은 원하는 동작을 보여주는 소수의 입력-출력 예시를 제공합니다. GAIA는 두 방식을 모두 사용합니다. 새로운 워크플로에는 제로샷 러닝을, 반복적인 데이터 추출 작업에는 퓨샷 러닝을 활용합니다.

제로샷 러닝

이해하기 제로샷 러닝

GAIA 활용 방법 제로샷 러닝

관련 개념

퓨샷 러닝

프롬프트 엔지니어링

대형 언어 모델 (LLM)

대형 언어 모델 (LLM)

자주 묻는 질문

더 탐색

GAIA를 대안과 비교

당신의 역할을 위한 GAIA

Stop doing everything yourself.

제로샷 러닝

이해하기 제로샷 러닝

GAIA 활용 방법 제로샷 러닝

관련 개념

퓨샷 러닝

프롬프트 엔지니어링

대형 언어 모델 (LLM)

대형 언어 모델 (LLM)

자주 묻는 질문

더 탐색

GAIA를 대안과 비교

당신의 역할을 위한 GAIA

Stop doing everything yourself.

이해하기 제로샷 러닝

GAIA 활용 방법 제로샷 러닝

관련 개념

퓨샷 러닝

프롬프트 엔지니어링

대형 언어 모델 (LLM)

대형 언어 모델 (LLM)

자주 묻는 질문