Zero-Shot Learning
Zero-shot learning é a capacidade de um modelo de IA realizar tarefas para as quais nunca foi treinado explicitamente, confiando em conhecimento geral e raciocínio, em vez de exemplos específicos da tarefa.
Entendendo Zero-Shot Learning
O aprendizado de máquina tradicional requer exemplos rotulados para cada tarefa: para classificar emails, é preciso milhares de exemplos rotulados. Zero-shot learning rompe essa limitação. Grandes modelos de linguagem treinados em extensos acervos de textos desenvolvem habilidades gerais de raciocínio que transferem para tarefas inéditas descritas em linguagem natural. Você pode pedir a um modelo zero-shot para classificar emails em categorias que ele nunca viu antes, apenas descrevendo o que cada categoria significa. Capacidades zero-shot surgiram como uma propriedade surpreendente da escala. Modelos menores exigem exemplos few-shot para ter bom desempenho em novas tarefas. Modelos suficientemente grandes conseguem seguir descrições de tarefas sem qualquer exemplo. Essa propriedade é fundamental para a utilidade dos LLMs: você pode aplicá-los imediatamente a novas tarefas, sem coleta e rotulação de dados. Em tarefas de classificação, zero-shot learning normalmente funciona fazendo o modelo avaliar quão bem cada rótulo candidato se encaixa na entrada. Em tarefas de geração, funciona fornecendo instruções claras da tarefa. A qualidade do desempenho zero-shot depende fortemente da clareza com que a tarefa é descrita e de quão relacionada ela está ao universo de dados com que o modelo foi treinado. Zero-shot learning está intimamente relacionado ao in-context learning e ao instruction following. LLMs modernos que foram ajustados para seguir instruções (instruction-fine-tuned) são especialmente bons em tarefas zero-shot, pois foram treinados para interpretar e seguir instruções inéditas de forma confiável.
Como GAIA usa Zero-Shot Learning
A GAIA utiliza o zero-shot learning para lidar com solicitações de automação que nunca encontrou antes. Quando você descreve um novo fluxo de trabalho em linguagem natural, o LLM da GAIA interpreta a descrição da tarefa e gera a sequência de ações apropriada sem precisar de exemplos pré-programados. Isso permite que a GAIA lide com a enorme variedade de fluxos de trabalho de produtividade criados pelos usuários sem exigir treinamentos personalizados para cada um.
Conceitos relacionados
Few-Shot Learning
Few-shot learning é a capacidade de um modelo de IA adaptar-se a uma nova tarefa ou formato de saída a partir de apenas alguns exemplos de entrada e saída fornecidos no prompt, sem qualquer atualização dos pesos.
Engenharia de Prompt
Engenharia de prompt é a prática de projetar e refinar entradas para modelos de linguagem de IA, a fim de obter respostas desejadas de forma consistente, moldando o comportamento do modelo sem modificar seus pesos.
Large Language Model (LLM)
Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de deep learning treinado com enormes conjuntos de textos capaz de compreender, gerar e raciocinar sobre linguagem humana em uma ampla variedade de tarefas.
Modelo de Linguagem de Grande Porte (LLM)
Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de inteligência artificial treinado em enormes quantidades de dados textuais, capaz de compreender, gerar e raciocinar sobre a linguagem humana com grande fluência.


