Mission 4

Mit eigenen Dokumenten sprechen

Du hängst harmlose Beispieldokumente an einen lokalen Chat und erlebst, wie die KI daraus zitiert — samt der wichtigen Frage: Woher weiss ich, dass das stimmt?

Dauer: ca. 45 Minuten
Lernziel: Ein lokales Dokumenten-Q&A läuft: Deine Dateien beantworten Fragen, du kennst Quellenprüfung und Grenzen.
Voraussetzungen: Mission 1 (LM Studio + Standardmodell) · drei unkritische Beispieldokumente

Das Ziel

Bisher wusste deine lokale KI nur, was im Training steckte. Heute gibst du ihr deine Inhalte — komplett offline-tauglich, ohne dass ein Dokument dein Gerät verlässt. LM Studio kann Dateien direkt im Chat entgegennehmen (offiziell unterstützt: .pdf, .docx, .txt — anhand der LM-Studio-Doku geprüft, Stand 02.07.2026).

Schritt 1: Ungefährliche Testdokumente wählen

Für den ersten Versuch gilt die Sicherheitsregel: Übe mit Unkritischem. Gut geeignet: eine Bedienungsanleitung als PDF, ein öffentlicher Bericht, ein selbst geschriebenes Rezept- oder Reise-Dokument. Noch nicht: Steuerunterlagen, Arztberichte, fremde Personendaten — nicht weil die Technik unsicher wäre (alles bleibt lokal), sondern weil du Fehlerbilder erst an harmlosem Material kennenlernen sollst.

Lege die drei Dateien in KI-Experimente\Eingang (dein Ordner aus KM4).

Schritt 2: Dokument anhängen und befragen

Frischer Chat, dein Standardmodell.
Hänge ein Dokument an (Büroklammer-/Anhang-Funktion im Chatfeld).
Frage konkret — und verlange Belege:

Was steht in diesem Dokument zu [dein Thema]? Zitiere die relevante Stelle wörtlich.

Erwartetes Ergebnis: Eine Antwort, die sich erkennbar auf dein Dokument stützt, idealerweise mit Zitat. Prüfe das Zitat im Original nach — Vertrauen ist gut, Nachschlagen ist Kursprinzip.

Schritt 3: Verstehen, was gerade passiert ist

LM Studio entscheidet nach Dokumentlänge (so beschreibt es die offizielle Doku):

Kurzes Dokument → es wandert vollständig ins Kontextfenster. Beste Qualität, aber der Kontext-Preis aus Mission 3 fällt an.
Langes Dokument → RAG: Nur die relevantesten Ausschnitte werden herausgesucht und dem Modell gereicht. Skaliert auf dicke Wälzer — aber die Antwortqualität hängt jetzt an der Suche.

Praktische Folge (Tipp direkt aus der Doku): Formuliere Fragen mit den Begriffen, die im Dokument vorkommen dürften. «Was sagt Kapitel 3 zur Garantiedauer?» findet mehr als «Was ist da so drin?».

Schritt 4: Die Grenzen austesten — absichtlich

Jetzt wirst du zum Prüfer. Stelle drei Fangfragen:

Etwas, das NICHT im Dokument steht: «Was sagt das Dokument über den Mond?» — Gute Antwort: «Dazu steht hier nichts.» Schlechte: eine erfundene Passage (Halluzination!).
Etwas Quantitatives: Zahlen und Tabellen aus PDFs werden beim Extrahieren gern verstümmelt — prüfe eine konkrete Zahl im Original nach.
Etwas Verstreutes: Eine Frage, deren Antwort an zwei entfernten Stellen steht. Hier zeigt RAG seine Achillesferse: Findet die Suche nur eine Stelle, fehlt die halbe Wahrheit.

Notiere die Ergebnisse in deinem Maschinenraum-Protokoll — du baust gerade Urteilsvermögen auf, das den meisten KI-Nutzern fehlt.

Fehlerbehebung

«Das Dokument enthält dazu keine Informationen», obwohl es sie enthält: Frage mit Dokument-Vokabular umformulieren; grosses Dokument in kleinere Teile spalten; prüfen, ob das PDF überhaupt Text enthält (gescannte PDFs sind Bilder! Testweise Text im PDF-Viewer markieren).
Antworten dauern plötzlich sehr lange: Grosses Dokument im kleinen Kontext = viel Einlesearbeit (Mission 3 lässt grüssen). Kontextgrösse und Dokumentlänge ausbalancieren.
Wirre Zeichen im Zitat: PDF-Extraktion fehlgeschlagen — Dokument als .txt oder .docx exportieren und erneut anhängen.

Rücksetzweg

Chat löschen — damit sind Dokument und Auszüge aus dem Programm entfernt. Die Originaldateien in Eingang bleiben unberührt (das Prinzip «Originale nie anfassen» wird ab Mission 5 zur harten Agentenregel).

Kurz geprüft

3 Fragen zum Festigen — Feedback kommt sofort.

Dein 300-Seiten-Handbuch hängt im Chat. Was passiert laut Doku damit?

Die beste Sofortmassnahme, wenn die Dokumentsuche nichts findet?

Warum die Fangfrage nach etwas, das NICHT im Dokument steht?

Das kann ich jetzt

Ich befrage eigene Dokumente lokal — und weiss, wann Vollinjektion, wann RAG passiert.
Ich formuliere Suchanfragen, die der semantischen Suche Anker geben.
Ich teste Wissensassistenten mit Fangfragen und prüfe Zitate im Original.