Zum Inhalt springen
Lokale KI lernen
Modul 6: Erklärlektion

Vom Chatbot zum Agenten: Die fünf Stufen der Selbstständigkeit

Chat, Workflow, Automation, KI-Workflow, Agent — wer entscheidet was? Die Landkarte, mit der du jedes Automatisierungsprojekt richtig einordnest.

Dauer
ca. 30 Minuten
Lernziel
Du unterscheidest die fünf Automatisierungsstufen, kennst die Bausteine der Agentenschleife und wählst für eine Aufgabe die niedrigste ausreichende Stufe.
Voraussetzungen
Kernmodul 1 · ideal: Kernmodul 4 (lokale API)

Die entscheidende Frage: Wer entscheidet?

«Agent» ist zum Modewort geworden — dabei ist die Abgrenzung präzise: Es geht darum, wer den Ablauf bestimmt. Die fünf Stufen, sortiert nach wachsender Selbstständigkeit:

Stufe Wer entscheidet den Ablauf? Beispiel
1 · Chat du, bei jeder Nachricht Frage stellen, Antwort lesen
2 · Regelbasierte Automation fest verdrahtete Regeln «Anhänge automatisch in Ordner X»
3 · Workflow ein Mensch, im Voraus, Schritt für Schritt E-Mail → speichern → benachrichtigen
4 · KI-gestützter Workflow Mensch plant die Schritte, KI füllt einzelne aus E-Mail → KI fasst zusammen → Notiz ablegen
5 · Agent die KI plant die Schritte selbst «Recherchiere X und lege mir einen Bericht ab»

Die wichtigste Berufsregel der Automatisierer: Nimm die niedrigste Stufe, die die Aufgabe löst. Jede Stufe darüber kauft Flexibilität mit Unvorhersehbarkeit — ein Workflow macht denselben Fehler jedes Mal (leicht zu finden), ein Agent macht jedes Mal andere (schwer zu finden).

Die Anatomie eines Agenten

Was macht Stufe 5 technisch aus? Die Agentenschleife:

Zieldeine AufgabePlanennächster Schritt?HandelnTool ausführenBeobachtenhat es geklappt?Schleife, bis das Ziel erreicht istNot-Aus · Freigaben · Logs
Planen → Handeln → Beobachten, im Kreis — mit Sicherheitsnetz darunter.

Die Bausteine, die du dafür kombinierst (alle schon bekannt oder im Glossar):

  • Ein Sprachmodell als Planer — bei uns lokal, über die API aus Kernmodul 4.
  • Tools als Hände: Dateien lesen/schreiben, suchen, Nachrichten senden. Der technische Mechanismus dahinter heisst Function Calling — das Modell antwortet nicht mit Prosa, sondern mit einem strukturierten Werkzeugaufruf («rufe datei_lesen mit Pfad X»), den die umgebende Software ausführt. Zunehmend standardisiert über MCP.
  • Ein Trigger als Startsignal, oft ein Webhook.
  • Memory, damit der Agent über Durchläufe hinweg weiss, was er schon erledigt hat (die Grenzen kennst du aus KM5).
  • Das Sicherheitsnetz: Human in the Loop, Not-Aus, Protokolle. In diesem Kurs Pflichtausstattung.

Multi-Agenten — und wann weniger mehr ist

Mehrere spezialisierte Agenten können zusammenarbeiten (einer recherchiert, einer schreibt, einer prüft). Das ist mächtig — und um Grössenordnungen schwerer zu beherrschen: Fehler pflanzen sich fort, Kosten und Laufzeiten vervielfachen sich. Kurshaltung: Erst einen einzelnen Agenten sauber beherrschen (Kernmodul 7), Multi-Agenten als bewusstes Vertiefungsthema — praktisch ausprobierbar in Labor 9.

Vertiefung: Warum niedrigere Stufen oft die klügere Wahl sind

Ein Beispiel durchgespielt: «Neue Rechnungen im Ordner sollen in eine Übersicht.» Als Agent formuliert («kümmere dich um meine Rechnungen») muss das Modell jedes Mal neu entscheiden — und kann jedes Mal anders abbiegen. Als KI-Workflow (Stufe 4) ist der Ablauf fest: neue Datei → KI extrahiert Betrag und Datum → Zeile in Tabelle. Die KI tut nur, was sie am besten kann (unstrukturierten Text verstehen), alles andere ist verlässliche Mechanik. Stufe 5 hebst du dir für Aufgaben auf, deren Weg wirklich unvorhersehbar ist.

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

«Jeden Abend alle neuen PDFs zusammenfassen und ablegen» — welche Stufe braucht das?
Was unterscheidet Function Calling von einer normalen Chat-Antwort?
Warum ist ein Fehler im Agenten schwerer zu finden als im Workflow?

Das kann ich jetzt

  • Ich ordne jede Automatisierungsidee einer der fünf Stufen zu — und wähle die niedrigste ausreichende.
  • Ich kenne die Agentenschleife (Planen → Handeln → Beobachten) und ihre Bausteine inklusive Function Calling und MCP.
  • Ich kann begründen, warum Freigaben, Logs und Not-Aus zur Grundausstattung gehören.

Nächster Schritt: «Die Werkzeuglandschaft» — womit baut man das konkret?