Systematisch wählen statt raten
Ein Auswahlraster, das nicht veraltet: Aufgabe, Sprache, Hardware, Lizenz, Datenschutz — und Empfehlungsklassen für jede Speichergrösse.
Das Prinzip: Klasse vor Namen
Konkrete Modellnamen veralten in Monaten — das Auswahlraster dieser Lektion nicht. Du legst zuerst die Klasse fest (Grösse, Quantisierung, Modellart), dann erst suchst du innerhalb der Klasse nach aktuellen Kandidaten (dafür gibt es den Modell-Finder und später den Technologiekatalog).
Das Kriterienraster
Gehe die sechs Fragen in dieser Reihenfolge durch — jede filtert Kandidaten aus:
- Aufgabe: Chat/Schreiben → Instruct. Logik/Planung → Reasoning. Bilder verstehen → Vision. Dokumentensuche → Embedding (zusätzlich). Programmieren → Coding-Varianten. (Die Modellarten kennst du aus KM1.)
- Hardware: Dein Speicher setzt die Obergrenze — Tabelle unten.
- Sprache: Für Deutsch sind grosse europäische und chinesische Familien oft stark; verlässlich zeigt es nur der eigene Test (Mission 2 — dein Prüfungsbogen!).
- Tempo-Anspruch: Dauereinsatz und Agenten brauchen flotte Modelle (kleiner wählen); für gelegentliche Qualitätsarbeit darf es das grösste sein, das noch passt.
- Lizenz: Für privates Lernen fast immer unkritisch. Kommerzielle Nutzung: Lizenz vor dem Einsatz lesen — «Open Weights» (Gewichte frei herunterladbar) ist nicht automatisch «beliebig nutzbar»; manche Familien haben Nutzungsauflagen.
- Datenschutz: Lokal ist lokal — beim reinen Modell gibt es keinen Abfluss (dein Flugzeugmodus-Beweis aus Mission 1). Achtung eher bei Zusatzfunktionen der Programme (Websuche, Cloud-Fallbacks): bewusst ein- oder ausschalten.
Empfehlungsklassen nach Speicher
Richtwerte bei Q4, mit Luft für Kontext und System (Herleitung: KM2). RAM-Spalte gilt für Geräte ohne eigene GPU, VRAM/Unified für Modelle, die ganz auf der GPU bzw. im gemeinsamen Speicher laufen:
| Dein Speicher | Suchklasse (RAM/CPU) | Suchklasse (VRAM/Unified) |
|---|---|---|
| 8 GB | 1–3B | 3–4B (bei 6–8 GB VRAM) |
| 16 GB | 3–4B, mutig: 7–8B | 7–8B (bei 12 GB), 14B (bei 16 GB) |
| 32 GB | 7–14B | 14–32B (bei 24 GB) |
| 64 GB | 14–32B | 32–70B (Unified) |
| 128 GB+ | 32–70B | 70B+ (Unified/Multi-GPU) |
Der Entscheidungsbaum in Kurzform
Aufgabe bestimmen → Modellart fixiert · Speicher nachschlagen → Grössenklasse fixiert · Q4 als Start (KM1-Regel) · zwei Kandidaten verschiedener Familien laden → Prüfungsbogen aus Mission 2 → Standard küren. Bei Enttäuschung: erst Quantisierung/Grösse variieren, dann Familie wechseln.
Kurz geprüft
3 Fragen zum Festigen — Feedback kommt sofort.
Das kann ich jetzt
- Ich wende das Sechs-Fragen-Raster an: Aufgabe, Hardware, Sprache, Tempo, Lizenz, Datenschutz.
- Ich schlage meine Suchklasse in der Speichertabelle nach — für RAM- und VRAM-Betrieb.
- Ich kombiniere das Raster mit dem Mission-2-Prüfungsbogen zu einer belastbaren eigenen Wahl.
Nächster Schritt: «Modellfamilien und Benchmarks richtig lesen» — wer baut die Modelle, und was taugen Ranglisten?