Spickzettel

Alles Wichtige auf einer Seite — zum Nachschlagen oder Ausdrucken (). Alle Werte sind Näherungen; Herleitungen stehen in den verlinkten Lektionen.

Faustregeln (alles Näherungen!)

Tokens: Englisch ~0,75 Wörter/Token; Deutsch ~0,5–0,7. Normseite ≈ 250 Wörter. → Kontext-Rechner
Modellgrösse im Speicher (Q4): ≈ Parameter (Mrd.) × 0,5–0,6 GB. Plus Reserve für Kontext + System. → KM2
Quantisierung: Q4 = Standard; Q5/Q6 bei Platz; unter Q4 bricht Qualität ein. Mittleres Modell in Q4/Q5 schlägt grosses in Q2/Q3. → KM1
Tokens/s: 5–10 = gemächlich · 15–30 = flüssig · 50+ = komfortabel. → KM2
Speicher entscheidet, ob es läuft. Bandbreite, wie schnell. RAM + VRAM addieren sich nicht.
16-GB-Notebook: Suchklasse 3–4B (mutig 7–8B) in Q4. → Modell-Finder

Freier Speicherplatz: Get-PSDrive C
Lokale KI-API testen: Invoke-RestMethod http://localhost:1234/v1/models
Task-Manager (RAM live): Ctrl + Shift + Esc → Leistung
Agent starten: python "$HOME\KI-Experimente\ordner-agent.py" · Stopp: Ctrl+C oder STOP.txt in den Eingang

Downloads nur von offiziellen Quellen, https, im Zweifel Defender-Scan (KM4)
Berechtigungsmodell schriftlich: darf immer / nur mit Freigabe / nie (KM7)
Originale nie überschreiben; verschieben statt löschen; Backup vor Produktivstart
Protokoll + Not-Aus + Limits (Schleifen, Zeit, Kosten) (KM8)
Secrets in Umgebungsvariablen — nie im Skript, Chat oder Screenshot
Fernzugriff: erst VPN-Tunnel, nie Portfreigaben (KM9)
Ohne ausdrückliche Freigabe nie: E-Mail senden, kaufen, endgültig löschen, veröffentlichen, Fremde kontaktieren