Zum Inhalt springen
Lokale KI lernen
Modul 5: Entscheidungslektion

Deinen Wissensassistenten verlässlich machen

Quellenpflicht, Umgang mit Unsicherheit, veraltete Dokumente, Metadaten — die Betriebsregeln, die aus einem Spielzeug ein Werkzeug machen.

Dauer
ca. 25 Minuten
Lernziel
Du legst Betriebsregeln für deinen lokalen Wissensassistenten fest: Quellenpflicht, Unsicherheitsmarkierung, Aktualisierungsroutine und Dokumentenhygiene.
Voraussetzungen
Lektion «RAG verstehen» · Mission 4

Vom Experiment zum Werkzeug

Mission 4 hat funktioniert — jetzt kommt die Frage, die über den Dauereinsatz entscheidet: Wie verhindere ich, dass mein Assistent mich selbstbewusst anlügt? Die Antwort sind vier Betriebsregeln. Sie gelten für jedes RAG-Werkzeug, von LM Studio bis zu den Spezialisten wie AnythingLLM oder GPT4All.

Regel 1: Quellenpflicht im Systemprompt

Verankere die Quellenpflicht dauerhaft (Baustein für deine systemprompts.md aus KM4):

Antworte nur auf Grundlage der bereitgestellten Dokumente. Nenne zu jeder Aussage die Fundstelle (Dokumentname, wenn möglich Abschnitt). Wenn die Dokumente eine Frage nicht beantworten, sage genau das — ergänze fehlendes Wissen nicht aus deinem Gedächtnis, ausser ich bitte ausdrücklich darum.

Der letzte Halbsatz ist der wichtigste: Er zieht die Grenze zwischen «steht in meinen Unterlagen» und «meint das Modell» — die zwei Wissenssorten, die du nie vermischen willst.

Regel 2: Unsicherheit sichtbar machen

Ergänze: «Wenn Fundstellen einander widersprechen oder unvollständig wirken, weise ausdrücklich darauf hin.» Ein guter Assistent sagt «Dokument A nennt 30 Tage, Dokument B 14 — bitte prüfen» statt stillschweigend eines auszuwählen. Teste das mit zwei absichtlich widersprüchlichen Textdateien — ein Fünf-Minuten-Experiment, das dir zeigt, wie dein Werkzeug mit Konflikten umgeht.

Regel 3: Dokumentenhygiene

Die Suche findet, was da ist — auch Veraltetes. Deshalb:

  • Ein Wissensordner, bewusst befüllt. Nicht «alles rein»: Jedes zusätzliche irrelevante Dokument verwässert die Suche.
  • Veraltetes raus oder markieren. Alte Versionen löschen oder mit Präfix (ALT_...) kennzeichnen und den Assistenten anweisen, solche Dateien zu ignorieren.
  • Sprechende Dateinamen (Mietvertrag_Musterstrasse_2024.pdf statt scan_final2.pdf) — sie sind oft Teil der Metadaten, die die Suche und die Quellenangabe nutzt.
  • Gescannte PDFs prüfen: ohne Textebene (OCR) sind sie für RAG unsichtbar — der Markiertest aus Mission 4.

Regel 4: Aktualisierungsroutine

Wissensbestände leben. Lege einen einfachen Rhythmus fest: Neue Dokumente in den Wissensordner → Index des Werkzeugs aktualisieren (je nach Programm automatisch beim Anhängen oder per «Re-Index») → eine Stichprobenfrage zu den neuen Inhalten. Drei Minuten, die verhindern, dass du wochenlang gegen einen veralteten Index fragst.

Vertiefung: Wann lohnt ein RAG-Spezialwerkzeug?

Der Dokumenten-Chat in LM Studio ist für Einzeldokumente und schnelle Fragen gebaut. Spezialisten wie AnythingLLM oder GPT4All verwalten dauerhafte Wissensräume: ganze Ordner, getrennte Themenbereiche, einstellbare Embedding-Modelle, sichtbare Fundstellen. Wechsle, wenn du regelmässig denselben Bestand befragst — die Betriebsregeln dieser Lektion nimmst du unverändert mit. (Werkzeugprofile: Technologiekatalog.)

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

Dein Assistent beantwortet eine Frage, obwohl deine Dokumente dazu nichts enthalten. Welche Regel greift?
Zwei Dokumentversionen nennen verschiedene Kündigungsfristen. Was soll der Assistent tun?
Warum verschlechtert «einfach alles in den Wissensordner» die Antworten?

Das kann ich jetzt

  • Ich verankere Quellenpflicht und Unsicherheitsmarkierung im Systemprompt.
  • Ich halte meinen Wissensordner sauber: bewusst befüllt, Veraltetes markiert, Scans mit OCR.
  • Ich habe eine Aktualisierungsroutine — und weiss, dass RAG findet, nicht prüft.

Nächster Schritt: Kernmodul 6 — vom Assistenten, der antwortet, zum Agenten, der handelt.