Commit graph

18 commits

Author SHA1 Message Date
a6f7f968b5 fix: Test-Timeout verhindert hängenden Loop
runTestsParallel() wrappte jede Test-Suite mit 'timeout N bash -c ...'
(Standard: 120s). Exit 124 wird als Timeout erkannt und im Output markiert.

Neues Flag --test-timeout N für Integration-Tests die länger brauchen:
  /optimize "..." --test-timeout 300

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 23:47:06 +02:00
14c47ecd01 fix: sendAndWait-Retry + Judge-Server-Bereitschaftscheck vor Loop
- sendAndWait(): fängt "Agent is already processing" mit exponentiellem
  Backoff ab (5 Versuche: 500ms, 1s, 2s, 4s). Race Condition zwischen
  waitForIdle() und sendUserMessage() wird damit toleriert.
- /optimize: prüft Port 8002 vor dem Loop (20× alle 3s = max. 60s).
  Bei 503 "Loading model" wird gewartet statt sofort zu scheitern.
  Ist der Server nach 60s nicht erreichbar: Abbruch mit Hinweis.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 21:44:37 +02:00
2c07fb9d1c feat: automatische Test-Erkennung + parallele Ausführung in /optimize
Tests werden jetzt von der Extension selbst erkannt und als parallele
CPU-Prozesse gestartet — Judge bekommt den fertigen Output und führt
keine Tests mehr selbst aus.

- detectTestCommands(): erkennt pytest, npm test, cargo, go test, make test
  anhand von Framework-Markern (alle Checks parallel via Promise.all)
- runTestsParallel(): startet alle erkannten Suiten gleichzeitig, kombiniert
  Output mit Status-Header pro Suite (max. 6000 Zeichen gesamt)
- /optimize: Auto-Erkennung läuft einmalig nach Coder-Phase, vor dem Loop
- --test-cmd bleibt als Override für Sonderfälle erhalten
- Fallback: kein Framework erkannt → Judge führt Tests wie bisher selbst aus

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 21:39:21 +02:00
d5a2c10fa6 fix: --test-cmd in finalNotify-Widget ergänzt
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 21:14:01 +02:00
6afcd6a271 feat: --test-cmd für /optimize — Tests laufen in Extension, nicht im Judge
Neues Flag: /optimize <auftrag> --test-cmd "pytest -x"

Die Extension führt den Test-Befehl vor jedem Judge-Call selbst aus (pi.exec).
Judge bekommt den Output fertig übergeben und muss keine Tests mehr starten.
Das entkoppelt Test-Laufzeit vom LLM-Call und spart Judge-Inferenz-Zeit.

- judgeWithTestsPrompt(): wie judgePrompt, aber mit Test-Output im Prompt,
  explizites Verbot weitere Tests zu starten
- runTests(): führt Shell-Befehl aus, kürzt Output auf 6000 Zeichen
- Ohne --test-cmd: bisheriges Verhalten unverändert

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 21:10:25 +02:00
0fb0ec9e5d fix: /optimize --continue schreibt Zusatzauftrag in TASK.md
Wenn --continue mit einem Auftragstext kombiniert wird, wurde writeTaskMd()
bisher nicht aufgerufen — der Text wurde ignoriert. Jetzt wird er als
Zusatzauftrag angehängt, bevor die Judge→Fix-Schleife startet.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 21:07:16 +02:00
8bdf73b4ce docs: CLAUDE.md — Architektur, Deploy-Workflow, GPU-Setup
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 20:03:34 +02:00
4a31535b76 feat: /plan, /cancel, /continue, /discard + Context 262144 + KV-Cache q4_0
- Neue Befehle: /plan (Planungsmodus, nur PLAN.md), /cancel (Loop-Abbruch),
  /continue (Resume nach Unterbrechung), /discard (PLAN.md verwerfen)
- contextWindow in models.json und llama.cpp-Servern: 131072 → 262144
- KV-Cache: q8_0 → q4_0 (weniger VRAM, passt zu 262k-Kontext auf 2× 3090)
- parallel: 2 → 1 beim Coder (stabiler bei großem Kontext)
- Optimize-Status mit ASCII-Fortschrittsbalken + Blocker-Preview
- cancelRequested-Flag prüft nach jedem Loop-Schritt

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-20 20:02:20 +02:00
b19c189e2e feat: prominente Abschluss-Notifications + Widget-Update für /optimize und /shipit 2026-05-20 02:08:09 +02:00
7cb299ff66 feat: /optimize --continue überspringt Implementierungsphase 2026-05-20 01:42:26 +02:00
aa00a8282e fix: Judge contextWindow in models.json auf 131072 korrigiert 2026-05-20 01:27:52 +02:00
1da712f0b8 fix: Judge-Kontext auf 131072 erhöht (war 65536, zu klein bei langen Optimize-Runden) 2026-05-20 01:20:07 +02:00
120f223c9b docs: umfassende README + BEDIENUNGSANLEITUNG mit llama.cpp-Parametern und Beispielen 2026-05-19 21:22:02 +02:00
8dddd0eabd docs: start-servers.sh in README ergänzt 2026-05-19 19:11:15 +02:00
da961e65f6 feat: start-servers.sh startet Coder und Judge parallel 2026-05-19 19:05:29 +02:00
59b16059cc feat: stop-servers.sh, status.sh, README.md 2026-05-19 18:57:31 +02:00
6c128f5cf6 fix: install.sh kopiert statt Symlinks zu setzen 2026-05-19 18:51:07 +02:00
4074e10c1a chore: init pi_coder repository
Pi agent extension, model config, and LLaMA server startup scripts
for the coder/judge workflow (ports 8001/8002).
2026-05-19 18:21:34 +02:00