fix: Judge-Kontext auf 131072 erhöht (war 65536, zu klein bei langen Optimize-Runden)

This commit is contained in:
Dieter Schlüter 2026-05-20 01:20:07 +02:00
commit 1da712f0b8
2 changed files with 3 additions and 3 deletions

View file

@ -153,7 +153,7 @@ und dann neu gestartet — ein laufender Inference-Request wird dabei abgebroche
| Parameter | Wert | Erklärung / Wirkung |
|---|---|---|
| `-c 65536` | 64K Tokens | Mittleres Kontextfenster: reicht für Code-Review des letzten Commits + Konversationshistorie. |
| `-c 131072` | 128K Tokens | Großes Kontextfenster: nötig bei langen /optimize-Runden, wo der Gesprächsverlauf stark anwächst. |
| `-n 8192` | 8K Tokens | Reviews müssen nicht länger sein. Spart Inferenz-Zeit. |
| `--temp 0.1` | — | Sehr niedrige Temperatur: maximale Konsistenz und Reproduzierbarkeit der Urteile. |
| `--top-p 0.9` | — | Etwas enger als beim Coder — weniger Variation im Urteil gewünscht. |
@ -201,7 +201,7 @@ Bei einer **24-GB-GPU** ist nur ein Server gleichzeitig sinnvoll betreibbar:
-n 8192 # statt 16384
# Judge — Kontext reduzieren
-c 32768 # statt 65536
-c 32768 # statt 131072
```
Bei einer **16-GB-GPU** ist die Modellgröße allein schon grenzwertig.