Quantos exemplos o aprendizado few-shot precisa?

Geralmente de três a dez exemplos é suficiente para a maioria das tarefas. O número ideal depende da complexidade e da consistência esperada no formato de saída. Muitos exemplos desperdiçam espaço na janela de contexto; poucos exemplos podem não transmitir o padrão desejado por completo.

Few-Shot Learning

Few-shot learning é a capacidade de um modelo de IA adaptar-se a uma nova tarefa ou formato de saída a partir de apenas alguns exemplos de entrada e saída fornecidos no prompt, sem qualquer atualização dos pesos.

Entendendo Few-Shot Learning

Few-shot learning é uma das propriedades mais úteis, na prática, dos grandes modelos de linguagem. Ao incluir alguns exemplos do mapeamento de entrada e saída desejado no prompt, é possível direcionar o modelo de forma confiável para um formato de saída, estilo ou padrão de raciocínio específico. Isso também é chamado de aprendizado no contexto, pois a aprendizagem ocorre na janela de contexto, em vez de via atualizações de gradiente. Por exemplo, mostrar ao modelo três exemplos de como extrair detalhes de tarefas de e-mails ensina-o a extrair tarefas consistentemente de novos e-mails, mesmo quando estes estão escritos de forma diferente. Isso é muito mais eficiente em termos de amostragem do que o aprendizado supervisionado tradicional, que requer milhares de exemplos rotulados para conseguir a mesma consistência. O few-shot prompting é particularmente poderoso para tarefas de saída estruturada: extrair campos específicos de texto não estruturado, converter descrições em objetos JSON ou classificar itens em categorias. Os exemplos definem tanto o formato esperado quanto os critérios de decisão de forma implícita. O número ideal de exemplos varia conforme a tarefa e o modelo. Mais exemplos geralmente aumentam a consistência, mas consomem espaço na janela de contexto. Para tarefas complexas de extração, de três a dez exemplos costumam oferecer um bom equilíbrio. Técnicas avançadas como chain-of-thought few-shot learning incluem etapas de raciocínio nos exemplos para melhorar o desempenho em tarefas de raciocínio mais complexas.

Como GAIA usa Few-Shot Learning

A GAIA utiliza exemplos few-shot em prompts para tarefas que exigem geração estruturada e consistente, como extrair detalhes de tarefas de e-mails, interpretar informações de eventos de calendário a partir de linguagem natural ou categorizar mensagens por urgência. Ao fornecer exemplos representativos, os prompts da GAIA garantem que o LLM retorne dados exatamente no formato necessário para o processamento automatizado e uso de ferramentas.

Conceitos relacionados

Zero-Shot Learning

Zero-shot learning é a capacidade de um modelo de IA realizar tarefas para as quais nunca foi treinado explicitamente, confiando em conhecimento geral e raciocínio, em vez de exemplos específicos da tarefa.

Engenharia de Prompt

Engenharia de prompt é a prática de projetar e refinar entradas para modelos de linguagem de IA, a fim de obter respostas desejadas de forma consistente, moldando o comportamento do modelo sem modificar seus pesos.

Large Language Model (LLM)

Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de deep learning treinado com enormes conjuntos de textos capaz de compreender, gerar e raciocinar sobre linguagem humana em uma ampla variedade de tarefas.

Raciocínio em cadeia

Raciocínio em cadeia (Chain-of-thought, CoT) é uma técnica de prompting que instrui o modelo de IA a expor seus passos intermediários de raciocínio antes de chegar a uma resposta final, melhorando significativamente a precisão em problemas complexos de múltiplas etapas.

Perguntas frequentes

Use zero-shot quando a tarefa for simples e o modelo conseguir entendê-la apenas com a descrição. Use few-shot quando for preciso garantir formatação consistente, a tarefa for ambígua ou quiser demonstrar critérios de decisão específicos. A GAIA utiliza few-shot internamente para tarefas de extração estruturada de dados.

Few-Shot Learning

Entendendo Few-Shot Learning

Como GAIA usa Few-Shot Learning

Conceitos relacionados

Zero-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Raciocínio em cadeia

Perguntas frequentes

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.

Few-Shot Learning

Entendendo Few-Shot Learning

Como GAIA usa Few-Shot Learning

Conceitos relacionados

Zero-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Raciocínio em cadeia

Perguntas frequentes

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.

Entendendo Few-Shot Learning

Como GAIA usa Few-Shot Learning

Conceitos relacionados

Zero-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Raciocínio em cadeia

Perguntas frequentes

Quando devo usar prompting few-shot versus zero-shot?

Quantos exemplos o aprendizado few-shot precisa?

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.Stop doing everything yourself.

Entendendo Few-Shot Learning

Como GAIA usa Few-Shot Learning

Conceitos relacionados

Zero-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Raciocínio em cadeia

Perguntas frequentes

Quando devo usar prompting few-shot versus zero-shot?

Quantos exemplos o aprendizado few-shot precisa?

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.Stop doing everything yourself.

Stop doing everything yourself.

Stop doing everything yourself.