Deinen Wissensassistenten verlässlich machen
Quellenpflicht, Umgang mit Unsicherheit, veraltete Dokumente, Metadaten — die Betriebsregeln, die aus einem Spielzeug ein Werkzeug machen.
Vom Experiment zum Werkzeug
Mission 4 hat funktioniert — jetzt kommt die Frage, die über den Dauereinsatz entscheidet: Wie verhindere ich, dass mein Assistent mich selbstbewusst anlügt? Die Antwort sind vier Betriebsregeln. Sie gelten für jedes RAG-Werkzeug, von LM Studio bis zu den Spezialisten wie AnythingLLM oder GPT4All.
Regel 1: Quellenpflicht im Systemprompt
Verankere die Quellenpflicht dauerhaft (Baustein für deine systemprompts.md aus
KM4):
Antworte nur auf Grundlage der bereitgestellten Dokumente. Nenne zu jeder Aussage die Fundstelle (Dokumentname, wenn möglich Abschnitt). Wenn die Dokumente eine Frage nicht beantworten, sage genau das — ergänze fehlendes Wissen nicht aus deinem Gedächtnis, ausser ich bitte ausdrücklich darum.
Der letzte Halbsatz ist der wichtigste: Er zieht die Grenze zwischen «steht in meinen Unterlagen» und «meint das Modell» — die zwei Wissenssorten, die du nie vermischen willst.
Regel 2: Unsicherheit sichtbar machen
Ergänze: «Wenn Fundstellen einander widersprechen oder unvollständig wirken, weise ausdrücklich darauf hin.» Ein guter Assistent sagt «Dokument A nennt 30 Tage, Dokument B 14 — bitte prüfen» statt stillschweigend eines auszuwählen. Teste das mit zwei absichtlich widersprüchlichen Textdateien — ein Fünf-Minuten-Experiment, das dir zeigt, wie dein Werkzeug mit Konflikten umgeht.
Regel 3: Dokumentenhygiene
Die Suche findet, was da ist — auch Veraltetes. Deshalb:
- Ein Wissensordner, bewusst befüllt. Nicht «alles rein»: Jedes zusätzliche irrelevante Dokument verwässert die Suche.
- Veraltetes raus oder markieren. Alte Versionen löschen oder mit Präfix (
ALT_...) kennzeichnen und den Assistenten anweisen, solche Dateien zu ignorieren. - Sprechende Dateinamen (
Mietvertrag_Musterstrasse_2024.pdfstattscan_final2.pdf) — sie sind oft Teil der Metadaten, die die Suche und die Quellenangabe nutzt. - Gescannte PDFs prüfen: ohne Textebene (OCR) sind sie für RAG unsichtbar — der Markiertest aus Mission 4.
Regel 4: Aktualisierungsroutine
Wissensbestände leben. Lege einen einfachen Rhythmus fest: Neue Dokumente in den Wissensordner → Index des Werkzeugs aktualisieren (je nach Programm automatisch beim Anhängen oder per «Re-Index») → eine Stichprobenfrage zu den neuen Inhalten. Drei Minuten, die verhindern, dass du wochenlang gegen einen veralteten Index fragst.
Vertiefung: Wann lohnt ein RAG-Spezialwerkzeug?
Der Dokumenten-Chat in LM Studio ist für Einzeldokumente und schnelle Fragen gebaut. Spezialisten wie AnythingLLM oder GPT4All verwalten dauerhafte Wissensräume: ganze Ordner, getrennte Themenbereiche, einstellbare Embedding-Modelle, sichtbare Fundstellen. Wechsle, wenn du regelmässig denselben Bestand befragst — die Betriebsregeln dieser Lektion nimmst du unverändert mit. (Werkzeugprofile: Technologiekatalog.)
Kurz geprüft
3 Fragen zum Festigen — Feedback kommt sofort.
Das kann ich jetzt
- Ich verankere Quellenpflicht und Unsicherheitsmarkierung im Systemprompt.
- Ich halte meinen Wissensordner sauber: bewusst befüllt, Veraltetes markiert, Scans mit OCR.
- Ich habe eine Aktualisierungsroutine — und weiss, dass RAG findet, nicht prüft.
Nächster Schritt: Kernmodul 6 — vom Assistenten, der antwortet, zum Agenten, der handelt.