Spickzettel
Alles Wichtige auf einer Seite — zum Nachschlagen oder Ausdrucken (). Alle Werte sind Näherungen; Herleitungen stehen in den verlinkten Lektionen.
Faustregeln (alles Näherungen!)
- Tokens: Englisch ~0,75 Wörter/Token; Deutsch ~0,5–0,7. Normseite ≈ 250 Wörter. → Kontext-Rechner
- Modellgrösse im Speicher (Q4): ≈ Parameter (Mrd.) × 0,5–0,6 GB. Plus Reserve für Kontext + System. → KM2
- Quantisierung: Q4 = Standard; Q5/Q6 bei Platz; unter Q4 bricht Qualität ein. Mittleres Modell in Q4/Q5 schlägt grosses in Q2/Q3. → KM1
- Tokens/s: 5–10 = gemächlich · 15–30 = flüssig · 50+ = komfortabel. → KM2
- Speicher entscheidet, ob es läuft. Bandbreite, wie schnell. RAM + VRAM addieren sich nicht.
- 16-GB-Notebook: Suchklasse 3–4B (mutig 7–8B) in Q4. → Modell-Finder
Befehle (PowerShell)
- Freier Speicherplatz:
Get-PSDrive C - Lokale KI-API testen:
Invoke-RestMethod http://localhost:1234/v1/models - Task-Manager (RAM live): Ctrl + Shift + Esc → Leistung
- Agent starten:
python "$HOME\KI-Experimente\ordner-agent.py"· Stopp: Ctrl+C oderSTOP.txtin den Eingang
Sicherheits-Checkliste (jedes Projekt)
- Downloads nur von offiziellen Quellen, https, im Zweifel Defender-Scan (KM4)
- Berechtigungsmodell schriftlich: darf immer / nur mit Freigabe / nie (KM7)
- Originale nie überschreiben; verschieben statt löschen; Backup vor Produktivstart
- Protokoll + Not-Aus + Limits (Schleifen, Zeit, Kosten) (KM8)
- Secrets in Umgebungsvariablen — nie im Skript, Chat oder Screenshot
- Fernzugriff: erst VPN-Tunnel, nie Portfreigaben (KM9)
- Ohne ausdrückliche Freigabe nie: E-Mail senden, kaufen, endgültig löschen, veröffentlichen, Fremde kontaktieren
Modellwahl in 5 Schritten
- Aufgabe → Modellart (Instruct-Standard; Reasoning für Logik; Vision für Bilder)
- Speicher → Grössenklasse (Tabelle in KM3)
- Q4 laden, zwei Familien parallel
- Prüfungsbogen fahren (Mission 2): Qualität, Deutsch, Tempo
- Standard küren, Begründung notieren
Wenn etwas klemmt
- Modell neu laden → Programm neu starten → Rechner neu starten
- RAM prüfen (zu gross? → kleiner/stärker quantisiert/kürzerer Kontext)
- Update prüfen → Fehlermeldung wörtlich sichern → Issues durchsuchen (KM10)