Tool-Nutzung
Tool Use ist die Fähigkeit von KI-Agenten, externe Funktionen, APIs, Datenbanken und Dienste aufzurufen, um Informationen abzurufen oder Handlungen in der realen Welt auszuführen – über die reine Texterzeugung hinaus.
Verstehen Tool-Nutzung
Reine Sprachmodelle können nur Text generieren. Durch Tool Use werden sie zu Agenten, die aktiv handeln können. Wenn ein LLM Zugriff auf Werkzeuge hat, kann es beschließen, eine Funktion aufzurufen, um im Web zu suchen, eine Datei zu lesen, eine Datenbank abzufragen, eine E-Mail zu senden oder mit einer beliebigen API zu interagieren. Das Modell erhält die Ausgabe des Werkzeuges und integriert diese in seine Überlegungen. So entsteht ein Kreislauf aus Denken, Handeln und Beobachten, der die Ausführung komplexer, mehrstufiger Aufgaben ermöglicht. Tool Use funktioniert über ein standardisiertes Protokoll. Das LLM erhält eine Liste verfügbarer Werkzeuge mit Namen, Beschreibungen und Parameter-Schemata. Wenn das Modell feststellt, dass ein Tool aufgerufen werden soll, erzeugt es einen strukturierten Tool Call (typischerweise JSON) mit Funktionsnamen und Argumenten. Die Anwendung führt den Aufruf aus, sammelt das Ergebnis und gibt es dem Modell als neue Nachricht zurück. Nun setzt das Modell seine Überlegungen auf Grundlage der Werkzeugausgabe fort. Die Qualität der Werkzeugbeschreibungen beeinflusst entscheidend, ob das Modell die Werkzeuge korrekt aufruft. Gut geschriebene Beschreibungen vermitteln dem Modell, wann ein Tool eingesetzt werden soll, was es tut und welche Parameter erforderlich sind. Schlechte Beschreibungen führen zu fehlerhaften Werkzeugauswahlen oder falsch strukturierten Argumenten. ReAct (Reasoning and Acting) ist ein beliebtes Muster für Tool Use. Dabei wechseln sich Denk-, Handlungs- und Beobachtungsschritte ab; das Modell überlegt, was zu tun ist, handelt, beobachtet das Ergebnis und entscheidet dann über weitere Schritte.
Wie GAIA verwendet Tool-Nutzung
Die Nutzung von Werkzeugen (Tool Use) ist zentral für GAIA's Fähigkeit, mit Ihren digitalen Tools zu interagieren. GAIAs Agent:innen verwenden Tool-Calls, um Gmail-Nachrichten zu lesen und zu versenden, Kalendereinträge zu erstellen und zu aktualisieren, Aufgaben in Todoist und Linear zu verwalten, bei Slack zu posten, Datenbanken abzufragen und mit über 50 angebundenen Integrationen zu interagieren. Jedes Tool wird über MCP bereitgestellt und bietet dem Agenten eine strukturierte Beschreibung dessen, was das Tool macht und wie es korrekt aufgerufen wird.
Verwandte Konzepte
Funktionsaufruf
Funktionsaufruf ist eine Funktion von KI-Modellen, mit der sie strukturierte, maschinenlesbare Aufrufe vordefinierter Funktionen erzeugen können. Dadurch kann ein KI-System externe APIs und Tools zuverlässig mit den richtigen Argumenten ansprechen.
KI-Agent
Ein KI-Agent ist ein autonomes Softwaresystem, das seine Umgebung wahrnimmt, über Handlungen nachdenkt und Maßnahmen ergreift, um bestimmte Ziele ohne fortlaufende menschliche Anleitung zu erreichen.
Model Context Protocol (MCP)
Das Model Context Protocol (MCP) ist ein offener Standard, der es KI-Modellen ermöglicht, sich sicher über eine einheitliche Schnittstelle mit externen Tools, Datenquellen und Diensten zu verbinden.
API-Integration
API-Integration ist der Prozess, verschiedene Softwareanwendungen über deren Programmierschnittstellen (APIs) miteinander zu verbinden, um einen nahtlosen Austausch von Daten und Funktionen zu ermöglichen.
Agentische KI
Agentische KI beschreibt Systeme der künstlichen Intelligenz, die darauf ausgelegt sind, autonom zu agieren, Entscheidungen zu treffen und mehrstufige Aufgaben mit minimaler menschlicher Aufsicht auszuführen.


