Zum Inhalt springen
Lokale KI lernen

Druckansicht: Agenten und Automatisierung verstehen

Diese Ansicht enthält alle bisher produzierten Lektionen des Moduls in Lesereihenfolge. Über den Druckdialog deines Browsers («Als PDF speichern») erhältst du eine PDF-Datei.

Lokale KI lernen · Kernmodul 6

Agenten und Automatisierung verstehen

Vom Chatbot zum Agenten: Begriffe, Werkzeuge, Grenzen.

Stand: 4. Juli 2026

Lektion 1: Vom Chatbot zum Agenten: Die fünf Stufen der Selbstständigkeit

Erklärlektion· ca. 30 Minuten · Lernziel: Du unterscheidest die fünf Automatisierungsstufen, kennst die Bausteine der Agentenschleife und wählst für eine Aufgabe die niedrigste ausreichende Stufe.

Die entscheidende Frage: Wer entscheidet?

«Agent» ist zum Modewort geworden — dabei ist die Abgrenzung präzise: Es geht darum, wer den Ablauf bestimmt. Die fünf Stufen, sortiert nach wachsender Selbstständigkeit:

Stufe Wer entscheidet den Ablauf? Beispiel
1 · Chat du, bei jeder Nachricht Frage stellen, Antwort lesen
2 · Regelbasierte Automation fest verdrahtete Regeln «Anhänge automatisch in Ordner X»
3 · Workflow ein Mensch, im Voraus, Schritt für Schritt E-Mail → speichern → benachrichtigen
4 · KI-gestützter Workflow Mensch plant die Schritte, KI füllt einzelne aus E-Mail → KI fasst zusammen → Notiz ablegen
5 · Agent die KI plant die Schritte selbst «Recherchiere X und lege mir einen Bericht ab»

Die wichtigste Berufsregel der Automatisierer: Nimm die niedrigste Stufe, die die Aufgabe löst. Jede Stufe darüber kauft Flexibilität mit Unvorhersehbarkeit — ein Workflow macht denselben Fehler jedes Mal (leicht zu finden), ein Agent macht jedes Mal andere (schwer zu finden).

Die Anatomie eines Agenten

Was macht Stufe 5 technisch aus? Die Agentenschleife:

Zieldeine AufgabePlanennächster Schritt?HandelnTool ausführenBeobachtenhat es geklappt?Schleife, bis das Ziel erreicht istNot-Aus · Freigaben · Logs
Planen → Handeln → Beobachten, im Kreis — mit Sicherheitsnetz darunter.

Die Bausteine, die du dafür kombinierst (alle schon bekannt oder im Glossar):

  • Ein Sprachmodell als Planer — bei uns lokal, über die API aus Kernmodul 4.
  • Tools als Hände: Dateien lesen/schreiben, suchen, Nachrichten senden. Der technische Mechanismus dahinter heisst Function Calling — das Modell antwortet nicht mit Prosa, sondern mit einem strukturierten Werkzeugaufruf («rufe datei_lesen mit Pfad X»), den die umgebende Software ausführt. Zunehmend standardisiert über MCP.
  • Ein Trigger als Startsignal, oft ein Webhook.
  • Memory, damit der Agent über Durchläufe hinweg weiss, was er schon erledigt hat (die Grenzen kennst du aus KM5).
  • Das Sicherheitsnetz: Human in the Loop, Not-Aus, Protokolle. In diesem Kurs Pflichtausstattung.

Multi-Agenten — und wann weniger mehr ist

Mehrere spezialisierte Agenten können zusammenarbeiten (einer recherchiert, einer schreibt, einer prüft). Das ist mächtig — und um Grössenordnungen schwerer zu beherrschen: Fehler pflanzen sich fort, Kosten und Laufzeiten vervielfachen sich. Kurshaltung: Erst einen einzelnen Agenten sauber beherrschen (Kernmodul 7), Multi-Agenten als bewusstes Vertiefungsthema — praktisch ausprobierbar in Labor 9.

Vertiefung: Warum niedrigere Stufen oft die klügere Wahl sind

Ein Beispiel durchgespielt: «Neue Rechnungen im Ordner sollen in eine Übersicht.» Als Agent formuliert («kümmere dich um meine Rechnungen») muss das Modell jedes Mal neu entscheiden — und kann jedes Mal anders abbiegen. Als KI-Workflow (Stufe 4) ist der Ablauf fest: neue Datei → KI extrahiert Betrag und Datum → Zeile in Tabelle. Die KI tut nur, was sie am besten kann (unstrukturierten Text verstehen), alles andere ist verlässliche Mechanik. Stufe 5 hebst du dir für Aufgaben auf, deren Weg wirklich unvorhersehbar ist.

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

«Jeden Abend alle neuen PDFs zusammenfassen und ablegen» — welche Stufe braucht das?
Was unterscheidet Function Calling von einer normalen Chat-Antwort?
Warum ist ein Fehler im Agenten schwerer zu finden als im Workflow?

Das kann ich jetzt

  • Ich ordne jede Automatisierungsidee einer der fünf Stufen zu — und wähle die niedrigste ausreichende.
  • Ich kenne die Agentenschleife (Planen → Handeln → Beobachten) und ihre Bausteine inklusive Function Calling und MCP.
  • Ich kann begründen, warum Freigaben, Logs und Not-Aus zur Grundausstattung gehören.

Nächster Schritt: «Die Werkzeuglandschaft» — womit baut man das konkret?

Lektion 2: Die Werkzeuglandschaft: Womit baut man Workflows und Agenten?

Entscheidungslektion· ca. 25 Minuten · Lernziel: Du kennst die Werkzeugkategorien für Automatisierung, bewertest Kandidaten nach festen Kriterien und weisst, womit dieser Kurs baut.

Erst die Kategorie, dann das Produkt

Die Landschaft ist unübersichtlich, weil dauernd Neues erscheint. Ordnung schafft der Blick auf die Kategorie — Produktnamen wechseln, Kategorien bleiben (Profile: Stand Kurserstellung 07/2026; Prüfdaten je Produkt im Technologiekatalog):

Kategorie Charakter Bekannte Vertreter
Grafische Workflow-Baukästen Stufe 3–4 per Drag-and-drop, hunderte Anbindungen n8n, Node-RED (Heim-Klassiker), Dify
KI-Flow-Baukästen grafisch, spezialisiert auf LLM-Ketten und Chat-Apps Flowise, Langflow
RAG-/Chat-Plattformen fertige Oberflächen mit Dokumentenwissen, teils Agentenfunktionen Open WebUI, AnythingLLM
Agenten-Frameworks (Code) maximale Kontrolle, Programmierung nötig LangGraph, LlamaIndex, CrewAI, AutoGen, Haystack
Computer-Use-Werkzeuge KI bedient direkt Programme/Terminal — mächtig und riskant Open Interpreter u. ä.
Smart-Home-Zentralen Automatisierung im Haus, zunehmend mit KI-Anschluss Home Assistant (Labor 6)

Die Bewertungskriterien

Egal welche Kategorie — prüfe Kandidaten immer gegen dieselbe Liste (sie stammt direkt aus den Kurszielen): Anfängerfreundlichkeit · grafische Bedienung vs. Code · läuft es vollständig lokal? · Datenschutz (wohin telefoniert es?) · Windows-Kompatibilität · Stabilität und Projektaktivität (Kernmodul 10 zeigt, wie man das auf GitHub abliest) · Kosten/Lizenz · Agentenfunktionen (Tools, Freigaben, Logs) · Sicherheitsmodell (lassen sich Rechte begrenzen?).

Womit dieser Kurs baut

Für die Kursprojekte gilt der Grundsatz «so wenig Werkzeuge wie möglich»:

  • Kernmodul 7 (erster Agent): ein kleines, vollständig erklärtes Python-Skript plus die lokale API aus Kernmodul 4. Warum kein Baukasten? Weil du beim ersten Agenten jede Zeile verstehen sollst — Berechtigungen, Logs und Not-Aus inklusive. Keine Angst vor Python: Es sind wenige Dutzend Zeilen, jede wird erklärt, und du musst nichts davon auswendig können.
  • Mission 6 (Fernsteuerung): die eingebaute Weboberfläche bzw. ein Messenger-Anschluss — mit dem Sicherheitsmodell aus Kernmodul 9.
  • Wenn du lieber grafisch arbeitest: n8n oder Node-RED sind die naheliegenden Baukästen für Stufe-3/4-Projekte; die Konzepte des Kurses (Trigger, Tools, Freigaben, Logs) übertragen sich eins zu eins.

Der Entscheidungsweg

  1. Stufe bestimmen (letzte Lektion): Stufe 2–4 → Workflow-Baukasten; Stufe 5 → Framework oder eigenes Skript.
  2. Lokal-Pflicht? Streiche alles, was einen Cloud-Zwang hat.
  3. Kriterienliste durchgehen — besonders Projektaktivität und Sicherheitsmodell.
  4. Kleinstprojekt bauen (ein Trigger, ein Schritt) bevor du dich festlegst — eine Stunde Ausprobieren schlägt zehn Stunden Vergleichslektüre.

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

Warum baut Kernmodul 7 den ersten Agenten als kleines Skript statt mit einem mächtigen Framework?
Ein Automatisierungstool sieht toll aus, hatte aber seit einem Jahr kein Update und offene Sicherheitsmeldungen. Dein Schluss?
Was macht Computer-Use-Werkzeuge besonders riskant?

Das kann ich jetzt

  • Ich ordne Automatisierungswerkzeuge in sechs Kategorien ein — und Produkte kommen und gehen.
  • Ich bewerte Kandidaten nach der festen Kriterienliste, mit Projektaktivität und Sicherheitsmodell als Schwergewichten.
  • Ich weiss, womit der Kurs baut und warum — und wie ich grafische Alternativen einordne.

Nächster Schritt: Mission 5 und Kernmodul 7 — dein erster eigener Agent, mit Sicherheitsnetz.