Zero-Shot Learning
Zero-Shot Learning ist die Fähigkeit eines KI-Modells, Aufgaben zu erledigen, für die es nie explizit trainiert wurde, indem es auf Allgemeinwissen und logisches Denken zurückgreift, anstatt auf aufgabenspezifische Beispiele.
Verstehen Zero-Shot Learning
Traditionelles maschinelles Lernen erfordert gelabelte Beispiele für jede Aufgabe: Um E-Mails zu klassifizieren, benötigen Sie Tausende gelabelter E-Mails. Zero-Shot Learning durchbricht diese Einschränkung. Große Sprachmodelle, die auf umfangreichen Textkorpora trainiert wurden, entwickeln allgemeine Fähigkeiten zum logischen Denken, die auf neue, in natürlicher Sprache beschriebene Aufgaben übertragen werden können. Sie können ein Zero-Shot-Modell bitten, E-Mails in Ihnen unbekannte Kategorien zu sortieren, indem Sie einfach beschreiben, was jede Kategorie bedeutet. Zero-Shot-Fähigkeiten sind als überraschende Eigenschaft der Skalierung aufgetreten. Kleinere Modelle benötigen Few-Shot-Beispiele, um bei neuen Aufgaben gute Ergebnisse zu erzielen. Ausreichend große Modelle können Aufgabenbeschreibungen auch ohne Beispiele umsetzen. Diese Eigenschaft ist ein zentraler Grund für die Nützlichkeit von LLMs: Sie können sofort für neue Aufgaben eingesetzt werden, ohne Daten sammeln oder kennzeichnen zu müssen. Bei Klassifizierungsaufgaben funktioniert Zero-Shot Learning typischerweise so, dass das Modell bewertet, wie gut jede Kandidatenkategorie zum Input passt. Bei generativen Aufgaben werden klare Anweisungen zur Aufgabe bereitgestellt. Die Qualität der Zero-Shot-Leistung hängt stark davon ab, wie gut die Aufgabe beschrieben ist und wie eng sie mit dem Trainingsmaterial des Modells verwandt ist. Zero-Shot Learning steht in engem Zusammenhang mit In-Context Learning und dem Befolgen von Anweisungen. Moderne LLMs, die für das Befolgen von Anweisungen feinabgestimmt wurden, sind besonders gut bei Zero-Shot-Aufgaben, weil sie darauf trainiert wurden, neue Anweisungen zuverlässig zu interpretieren und auszuführen.
Wie GAIA verwendet Zero-Shot Learning
GAIA nutzt Zero-Shot Learning, um Automatisierungsanfragen zu bearbeiten, die ihr zuvor unbekannt sind. Wenn Sie einen neuen Arbeitsablauf in natürlicher Sprache beschreiben, interpretiert das LLM von GAIA die Aufgabenbeschreibung und erstellt die passende Aktionsabfolge – ganz ohne vorprogrammierte Beispiele. So kann GAIA eine enorme Vielfalt an Produktivitäts-Workflows der Nutzer:innen verarbeiten, ohne für jeden einzelnen Workflow ein spezielles Training zu benötigen.
Verwandte Konzepte
Few-Shot Learning
Few-Shot Learning bezeichnet die Fähigkeit eines KI-Modells, sich mithilfe weniger Eingabe-Ausgabe-Beispiele im Prompt auf eine neue Aufgabe oder ein neues Ausgabeformat einzustellen – ganz ohne Änderung der Modellparameter.
Prompt Engineering
Prompt Engineering ist die Praxis, Eingaben für KI-Sprachmodelle so zu entwerfen und zu verfeinern, dass zuverlässig gewünschte Ausgaben erreicht werden – und das ganz ohne Änderungen an den zugrunde liegenden Modellgewichten.
Large Language Model (LLM)
Ein Large Language Model (LLM) ist ein Deep-Learning-Modell, das auf riesigen Textdatensätzen trainiert wurde. Es kann menschliche Sprache verstehen, generieren und in einer Vielzahl von Aufgaben anwenden.
Large Language Model (LLM)
Ein Large Language Model (LLM) ist ein künstliches Intelligenzmodell, das mit riesigen Mengen an Textdaten trainiert wurde und menschliche Sprache bemerkenswert flüssig verstehen, generieren und verarbeiten kann.


