Zum Inhalt springen
Lokale KI lernen
Abschlussprojekt 1

Lokaler Wissensassistent

Aus Mission 4 und Kernmodul 5 wird ein fertiges Werkzeug: Deine Dokumente beantworten Fragen mit Quellenangabe, markieren Unsicherheiten — und bestehen einen echten Abnahmetest.

Dauer
ca. 120 Minuten
Lernziel
Ein dokumentierter, getesteter Wissensassistent für einen echten eigenen Dokumentenbestand — mit Quellenpflicht, Unsicherheitsmarkierung und bestandenem Abnahmetest.
Voraussetzungen
Mission 4 (Dokumenten-Chat) · KM5 (RAG verstehen, Betriebsregeln) · KM4 (Systemprompt-Sammlung)

Ziel und Nutzen

In Mission 4 hast du Dokumente ausprobiert, in KM5 die Betriebsregeln gelernt. Dieses Projekt macht daraus ein Werkzeug im Dauereinsatz: einen Assistenten für einen echten Dokumentenbestand deiner Wahl (Geräteanleitungen, Vereinsunterlagen, Rezeptsammlung, Projektnotizen), der

  • Fragen nur aus deinen Dokumenten beantwortet,
  • zu jeder Aussage die Fundstelle nennt,
  • Unsicherheiten und Widersprüche markiert statt sie zu überspielen,
  • und vollständig lokal bleibt — kein Dokument verlässt dein Gerät.

Der Unterschied zum Ausprobieren: Du definierst vorher, was «funktioniert» heisst (Erfolgskriterien), und weist es am Ende mit einem Abnahmetest nach — wie bei echter Software.

Architektur

Der Assistent besteht aus vier Bausteinen, die du alle schon kennst:

Baustein Rolle Erklärt in
Wissensordner ein bewusst befüllter Ordner, z. B. KI-Experimente\Wissen KM5 Regel 3 (Dokumentenhygiene)
Chat-Programm mit RAG findet passende Ausschnitte und reicht sie dem Modell KM5-L1 (Pipeline)
Sprachmodell formuliert Antworten aus den gefundenen Ausschnitten KM1/KM3 (dein Standardmodell)
Systemprompt erzwingt Quellenpflicht und Unsicherheitsmarkierung KM5 Regel 1+2, abgelegt in deiner systemprompts.md (KM4)

Es gibt keinen neuen Baustein — das Projekt ist die Disziplin, diese vier sauber zusammenzusetzen und zu prüfen.

Hardware, Software, Kosten

  • Hardware: dein Kursgerät (ab 16 GB RAM). Grössere Bestände profitieren von mehr Speicher — Einordnung im Hardware-Finder, Preisrahmen in Labor 1. Nötig ist nichts davon.
  • Software: LM Studio mit deinem Standardmodell (Missionen 1–4). Für dauerhafte, grössere Wissensräume sind Spezialwerkzeuge wie AnythingLLM die Ausbaustufe — Profile im Technologiekatalog, Abwägung in der KM5-Vertiefung «RAG-Spezialwerkzeug».
  • Kosten: CHF 0. Alle Werkzeuge des Kurswegs sind kostenlos nutzbar; es fallen keine API- oder Cloud-Gebühren an, weil nichts dein Gerät verlässt.

Datenschutz und Sicherheit

Das Projekt ist bewusst das datenschutzfreundlichste des Kurses: lokale Verarbeitung, keine Konten, keine Übertragung. Trotzdem gelten drei Regeln:

  1. Stufenweise scharf schalten. Erst mit unkritischen Dokumenten aufbauen und testen (Mission-4-Prinzip), erst nach bestandenem Abnahmetest sensible Bestände (Verträge, Gesundheitsunterlagen) aufnehmen.
  2. Der Assistent prüft keine Wahrheit. RAG findet, was da ist — auch Falsches (KM5-Kasten). Für Entscheidungen mit Geld-, Rechts- oder Gesundheitsfolgen bleibt das Original massgeblich.
  3. Backups unberührt lassen. Der Wissensordner enthält Kopien; Originale bleiben, wo sie sind. Damit ist auch der Rücksetzweg trivial.

Umsetzung in sechs Schritten

  1. Bestand wählen und Erfolgskriterien notieren. Ein Thema, 10–30 Dokumente. Schreibe drei Sätze auf: Wofür will ich den Assistenten benutzen? Welche drei Fragen muss er beantworten können? Woran erkenne ich, dass ich ihm vertrauen kann?
  2. Wissensordner aufbauen nach KM5 Regel 3: Kopien statt Originale, sprechende Dateinamen, Veraltetes raus oder mit ALT_-Präfix, gescannte PDFs auf Textebene prüfen (Markiertest).
  3. Systemprompt zusammensetzen. Nimm die Bausteine aus KM5 Regel 1 (Quellenpflicht) und Regel 2 (Unsicherheitsmarkierung) aus deiner systemprompts.md und kombiniere sie zu einem Assistenten-Prompt. Speichere ihn dort als «Wissensassistent v1».
  4. Zusammensetzen und Probelauf. Frischer Chat, Standardmodell, Systemprompt setzen, zwei bis drei Dokumente anhängen, eine deiner drei Kernfragen stellen. Fundstelle im Original nachschlagen — der Reflex aus Mission 4 wird hier zur Gewohnheit.
  5. Abnahmetest fahren (Abschnitt unten). Fehlschläge sind Befunde, keine Niederlagen: Frage umformulieren (Dokument-Vokabular!), Ordner aufräumen, Prompt nachschärfen — und den Test wiederholen.
  6. Betrieb dokumentieren. Halte in einer Textdatei im Wissensordner fest: Zweck, Modell, Prompt-Version, Datum des bestandenen Abnahmetests, Aktualisierungsrhythmus (KM5 Regel 4). Diese eine Seite macht aus dem Experiment ein Werkzeug, das du in einem Monat noch verstehst.

Der Abnahmetest

Zehn Fragen, vorher aufgeschrieben, Ergebnis protokolliert (bestanden/durchgefallen + Notiz):

  • 4 Faktenfragen, deren Antwort du kennst — Antwort und Fundstelle müssen stimmen.
  • 2 Fangfragen zu Inhalten, die nicht im Bestand stehen — erwartete Antwort: «steht nicht in den Dokumenten».
  • 2 Quantitative Fragen (Zahlen, Fristen, Tabellenwerte) — im Original nachprüfen (PDF-Extraktion ist die häufigste Fehlerquelle, Mission 4).
  • 1 Widerspruchsfrage: zwei Dokumente mit absichtlich verschiedenen Angaben — der Assistent muss den Konflikt offenlegen (KM5 Regel 2).
  • 1 Verstreute Frage, deren Antwort an zwei entfernten Stellen liegt — die bekannte RAG-Achillesferse; hier lernst du die Grenze deines Werkzeugs kennen.

Bestanden heisst: alle Faktenfragen korrekt mit Quelle, beide Fangfragen sauber abgewiesen, Widerspruch offengelegt. Die verstreute Frage darf scheitern — sie definiert, welche Fragen du diesem Assistenten künftig nicht anvertraust, und genau das gehört ins Betriebsprotokoll.

Rücksetzweg

Alles rückstandsfrei entfernbar: Chats im Programm löschen → Wissensordner löschen (es waren Kopien) → Systemprompt-Eintrag behalten oder aus systemprompts.md streichen. Deine Originale waren nie beteiligt.

Erfolgskriterien

Hake jede Zeile bewusst ab — erst dann ist das Projekt fertig:

  1. Erfolgskriterien und drei Kernfragen vor dem Bau notiert
  2. Wissensordner nach KM5-Hygieneregeln aufgebaut (Kopien, sprechende Namen, nichts Veraltetes)
  3. Systemprompt «Wissensassistent v1» in systemprompts.md dokumentiert
  4. Abnahmetest mit 10 protokollierten Fragen bestanden
  5. Betriebsblatt (Zweck, Modell, Prompt-Version, Testdatum, Rhythmus) liegt im Wissensordner
  6. Du benutzt ihn tatsächlich — das ehrlichste Kriterium von allen

Erweiterungen

  • Wissensräume statt Einzelchats: Umzug auf ein RAG-Spezialwerkzeug (AnythingLLM u. a., siehe Katalog) — Betriebsregeln und Abnahmetest nimmst du unverändert mit.
  • Zweiter Bestand, zweiter Assistent: getrennte Wissensordner pro Thema statt eines Sammeltopfs (KM5: Rauschen verwässert die Suche).
  • Brücke zu Projekt 2: Der Ordnerwächter aus Mission 5 kann neue Dokumente automatisch zusammenfassen und Aufgaben erkennen — daraus wird der sichere lokale Agent (Abschlussprojekt 2).

Das kann ich jetzt

  • Ich baue aus Wissensordner, RAG-Werkzeug, Modell und Systemprompt einen lokalen Wissensassistenten mit Quellenpflicht und Unsicherheitsmarkierung.
  • Ich weise mit einem selbst entworfenen Abnahmetest nach, was mein Assistent kann — und dokumentiere, was ich ihm nicht anvertraue.
  • Ich betreibe ihn nach festen Regeln (Hygiene, Aktualisierung, Betriebsblatt) statt auf Zuruf.