Few-Shot Learning
Few-shot learning é a capacidade de um modelo de IA adaptar-se a uma nova tarefa ou formato de saída a partir de apenas alguns exemplos de entrada e saída fornecidos no prompt, sem qualquer atualização dos pesos.
Entendendo Few-Shot Learning
Few-shot learning é uma das propriedades mais úteis, na prática, dos grandes modelos de linguagem. Ao incluir alguns exemplos do mapeamento de entrada e saída desejado no prompt, é possível direcionar o modelo de forma confiável para um formato de saída, estilo ou padrão de raciocínio específico. Isso também é chamado de aprendizado no contexto, pois a aprendizagem ocorre na janela de contexto, em vez de via atualizações de gradiente. Por exemplo, mostrar ao modelo três exemplos de como extrair detalhes de tarefas de e-mails ensina-o a extrair tarefas consistentemente de novos e-mails, mesmo quando estes estão escritos de forma diferente. Isso é muito mais eficiente em termos de amostragem do que o aprendizado supervisionado tradicional, que requer milhares de exemplos rotulados para conseguir a mesma consistência. O few-shot prompting é particularmente poderoso para tarefas de saída estruturada: extrair campos específicos de texto não estruturado, converter descrições em objetos JSON ou classificar itens em categorias. Os exemplos definem tanto o formato esperado quanto os critérios de decisão de forma implícita. O número ideal de exemplos varia conforme a tarefa e o modelo. Mais exemplos geralmente aumentam a consistência, mas consomem espaço na janela de contexto. Para tarefas complexas de extração, de três a dez exemplos costumam oferecer um bom equilíbrio. Técnicas avançadas como chain-of-thought few-shot learning incluem etapas de raciocínio nos exemplos para melhorar o desempenho em tarefas de raciocínio mais complexas.
Como GAIA usa Few-Shot Learning
A GAIA utiliza exemplos few-shot em prompts para tarefas que exigem geração estruturada e consistente, como extrair detalhes de tarefas de e-mails, interpretar informações de eventos de calendário a partir de linguagem natural ou categorizar mensagens por urgência. Ao fornecer exemplos representativos, os prompts da GAIA garantem que o LLM retorne dados exatamente no formato necessário para o processamento automatizado e uso de ferramentas.
Conceitos relacionados
Zero-Shot Learning
Zero-shot learning é a capacidade de um modelo de IA realizar tarefas para as quais nunca foi treinado explicitamente, confiando em conhecimento geral e raciocínio, em vez de exemplos específicos da tarefa.
Engenharia de Prompt
Engenharia de prompt é a prática de projetar e refinar entradas para modelos de linguagem de IA, a fim de obter respostas desejadas de forma consistente, moldando o comportamento do modelo sem modificar seus pesos.
Large Language Model (LLM)
Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de deep learning treinado com enormes conjuntos de textos capaz de compreender, gerar e raciocinar sobre linguagem humana em uma ampla variedade de tarefas.
Raciocínio em cadeia
Raciocínio em cadeia (Chain-of-thought, CoT) é uma técnica de prompting que instrui o modelo de IA a expor seus passos intermediários de raciocínio antes de chegar a uma resposta final, melhorando significativamente a precisão em problemas complexos de múltiplas etapas.


