Modul 6: Erklärlektion

Vom Chatbot zum Agenten: Die fünf Stufen der Selbstständigkeit

Chat, Workflow, Automation, KI-Workflow, Agent — wer entscheidet was? Die Landkarte, mit der du jedes Automatisierungsprojekt richtig einordnest.

Dauer: ca. 30 Minuten
Lernziel: Du unterscheidest die fünf Automatisierungsstufen, kennst die Bausteine der Agentenschleife und wählst für eine Aufgabe die niedrigste ausreichende Stufe.
Voraussetzungen: Kernmodul 1 · ideal: Kernmodul 4 (lokale API)

Die entscheidende Frage: Wer entscheidet?

«Agent» ist zum Modewort geworden — dabei ist die Abgrenzung präzise: Es geht darum, wer den Ablauf bestimmt. Die fünf Stufen, sortiert nach wachsender Selbstständigkeit:

Stufe	Wer entscheidet den Ablauf?	Beispiel
1 · Chat	du, bei jeder Nachricht	Frage stellen, Antwort lesen
2 · Regelbasierte Automation	fest verdrahtete Regeln	«Anhänge automatisch in Ordner X»
3 · Workflow	ein Mensch, im Voraus, Schritt für Schritt	E-Mail → speichern → benachrichtigen
4 · KI-gestützter Workflow	Mensch plant die Schritte, KI füllt einzelne aus	E-Mail → KI fasst zusammen → Notiz ablegen
5 · Agent	die KI plant die Schritte selbst	«Recherchiere X und lege mir einen Bericht ab»

Die wichtigste Berufsregel der Automatisierer: Nimm die niedrigste Stufe, die die Aufgabe löst. Jede Stufe darüber kauft Flexibilität mit Unvorhersehbarkeit — ein Workflow macht denselben Fehler jedes Mal (leicht zu finden), ein Agent macht jedes Mal andere (schwer zu finden).

Die Anatomie eines Agenten

Was macht Stufe 5 technisch aus? Die Agentenschleife:

Planen → Handeln → Beobachten, im Kreis — mit Sicherheitsnetz darunter.

Die Bausteine, die du dafür kombinierst (alle schon bekannt oder im Glossar):

Ein Sprachmodell als Planer — bei uns lokal, über die API aus Kernmodul 4.
Tools als Hände: Dateien lesen/schreiben, suchen, Nachrichten senden. Der technische Mechanismus dahinter heisst Function Calling — das Modell antwortet nicht mit Prosa, sondern mit einem strukturierten Werkzeugaufruf («rufe datei_lesen mit Pfad X»), den die umgebende Software ausführt. Zunehmend standardisiert über MCP.
Ein Trigger als Startsignal, oft ein Webhook.
Memory, damit der Agent über Durchläufe hinweg weiss, was er schon erledigt hat (die Grenzen kennst du aus KM5).
Das Sicherheitsnetz: Human in the Loop, Not-Aus, Protokolle. In diesem Kurs Pflichtausstattung.

Multi-Agenten — und wann weniger mehr ist

Mehrere spezialisierte Agenten können zusammenarbeiten (einer recherchiert, einer schreibt, einer prüft). Das ist mächtig — und um Grössenordnungen schwerer zu beherrschen: Fehler pflanzen sich fort, Kosten und Laufzeiten vervielfachen sich. Kurshaltung: Erst einen einzelnen Agenten sauber beherrschen (Kernmodul 7), Multi-Agenten als bewusstes Vertiefungsthema — praktisch ausprobierbar in Labor 9.

Vertiefung: Warum niedrigere Stufen oft die klügere Wahl sind

Ein Beispiel durchgespielt: «Neue Rechnungen im Ordner sollen in eine Übersicht.» Als Agent formuliert («kümmere dich um meine Rechnungen») muss das Modell jedes Mal neu entscheiden — und kann jedes Mal anders abbiegen. Als KI-Workflow (Stufe 4) ist der Ablauf fest: neue Datei → KI extrahiert Betrag und Datum → Zeile in Tabelle. Die KI tut nur, was sie am besten kann (unstrukturierten Text verstehen), alles andere ist verlässliche Mechanik. Stufe 5 hebst du dir für Aufgaben auf, deren Weg wirklich unvorhersehbar ist.

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

«Jeden Abend alle neuen PDFs zusammenfassen und ablegen» — welche Stufe braucht das?

Was unterscheidet Function Calling von einer normalen Chat-Antwort?

Warum ist ein Fehler im Agenten schwerer zu finden als im Workflow?

Das kann ich jetzt

Ich ordne jede Automatisierungsidee einer der fünf Stufen zu — und wähle die niedrigste ausreichende.
Ich kenne die Agentenschleife (Planen → Handeln → Beobachten) und ihre Bausteine inklusive Function Calling und MCP.
Ich kann begründen, warum Freigaben, Logs und Not-Aus zur Grundausstattung gehören.

Nächster Schritt: «Die Werkzeuglandschaft» — womit baut man das konkret?