O zero-shot learning sempre funciona?

Nem sempre. O desempenho do zero-shot pode diminuir em tarefas altamente especializadas, instruções ambíguas ou tarefas muito diferentes dos dados usados no treinamento do modelo. Incluir exemplos (few-shot) ou dividir tarefas em etapas menores (chain-of-thought) normalmente melhora os resultados em casos complexos.

Zero-Shot Learning

Zero-shot learning é a capacidade de um modelo de IA realizar tarefas para as quais nunca foi treinado explicitamente, confiando em conhecimento geral e raciocínio, em vez de exemplos específicos da tarefa.

Entendendo Zero-Shot Learning

O aprendizado de máquina tradicional requer exemplos rotulados para cada tarefa: para classificar emails, é preciso milhares de exemplos rotulados. Zero-shot learning rompe essa limitação. Grandes modelos de linguagem treinados em extensos acervos de textos desenvolvem habilidades gerais de raciocínio que transferem para tarefas inéditas descritas em linguagem natural. Você pode pedir a um modelo zero-shot para classificar emails em categorias que ele nunca viu antes, apenas descrevendo o que cada categoria significa. Capacidades zero-shot surgiram como uma propriedade surpreendente da escala. Modelos menores exigem exemplos few-shot para ter bom desempenho em novas tarefas. Modelos suficientemente grandes conseguem seguir descrições de tarefas sem qualquer exemplo. Essa propriedade é fundamental para a utilidade dos LLMs: você pode aplicá-los imediatamente a novas tarefas, sem coleta e rotulação de dados. Em tarefas de classificação, zero-shot learning normalmente funciona fazendo o modelo avaliar quão bem cada rótulo candidato se encaixa na entrada. Em tarefas de geração, funciona fornecendo instruções claras da tarefa. A qualidade do desempenho zero-shot depende fortemente da clareza com que a tarefa é descrita e de quão relacionada ela está ao universo de dados com que o modelo foi treinado. Zero-shot learning está intimamente relacionado ao in-context learning e ao instruction following. LLMs modernos que foram ajustados para seguir instruções (instruction-fine-tuned) são especialmente bons em tarefas zero-shot, pois foram treinados para interpretar e seguir instruções inéditas de forma confiável.

Como GAIA usa Zero-Shot Learning

A GAIA utiliza o zero-shot learning para lidar com solicitações de automação que nunca encontrou antes. Quando você descreve um novo fluxo de trabalho em linguagem natural, o LLM da GAIA interpreta a descrição da tarefa e gera a sequência de ações apropriada sem precisar de exemplos pré-programados. Isso permite que a GAIA lide com a enorme variedade de fluxos de trabalho de produtividade criados pelos usuários sem exigir treinamentos personalizados para cada um.

Conceitos relacionados

Few-Shot Learning

Few-shot learning é a capacidade de um modelo de IA adaptar-se a uma nova tarefa ou formato de saída a partir de apenas alguns exemplos de entrada e saída fornecidos no prompt, sem qualquer atualização dos pesos.

Engenharia de Prompt

Engenharia de prompt é a prática de projetar e refinar entradas para modelos de linguagem de IA, a fim de obter respostas desejadas de forma consistente, moldando o comportamento do modelo sem modificar seus pesos.

Large Language Model (LLM)

Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de deep learning treinado com enormes conjuntos de textos capaz de compreender, gerar e raciocinar sobre linguagem humana em uma ampla variedade de tarefas.

Modelo de Linguagem de Grande Porte (LLM)

Um Modelo de Linguagem de Grande Porte (LLM) é um modelo de inteligência artificial treinado em enormes quantidades de dados textuais, capaz de compreender, gerar e raciocinar sobre a linguagem humana com grande fluência.

Perguntas frequentes

O zero-shot learning não requer exemplos: o modelo trabalha apenas a partir da descrição da tarefa. O few-shot learning fornece um pequeno número de exemplos de entrada e saída que demonstram o comportamento desejado. A GAIA utiliza ambos: zero-shot para fluxos de trabalho inéditos e few-shot para tarefas consistentes de extração de dados.

Zero-Shot Learning

Entendendo Zero-Shot Learning

Como GAIA usa Zero-Shot Learning

Conceitos relacionados

Few-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Modelo de Linguagem de Grande Porte (LLM)

Perguntas frequentes

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.

Zero-Shot Learning

Entendendo Zero-Shot Learning

Como GAIA usa Zero-Shot Learning

Conceitos relacionados

Few-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Modelo de Linguagem de Grande Porte (LLM)

Perguntas frequentes

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.

Entendendo Zero-Shot Learning

Como GAIA usa Zero-Shot Learning

Conceitos relacionados

Few-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Modelo de Linguagem de Grande Porte (LLM)

Perguntas frequentes

Como o zero-shot learning é diferente do few-shot learning?

O zero-shot learning sempre funciona?

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.Stop doing everything yourself.

Entendendo Zero-Shot Learning

Como GAIA usa Zero-Shot Learning

Conceitos relacionados

Few-Shot Learning

Engenharia de Prompt

Large Language Model (LLM)

Modelo de Linguagem de Grande Porte (LLM)

Perguntas frequentes

Como o zero-shot learning é diferente do few-shot learning?

O zero-shot learning sempre funciona?

Explorar mais

Compare o GAIA com alternativas

GAIA para o seu papel

Stop doing everything yourself.Stop doing everything yourself.

Stop doing everything yourself.

Stop doing everything yourself.