dschlueter/pi_coder

Author	SHA1	Message	Date
dschlueter	f5d2a5d66e	fix: go-fibonacci ./... → . und Memoization-Aufgabe auf Single-Threaded einschränken ./... schlägt bei Single-Package-Modulen ohne Unterverzeichnisse fehl. Mutex-Hinweis verhindert Deadlock durch rekursive Lock-Acquisition. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 20:24:00 +02:00
dschlueter	64c2b7f0fd	feat: Demo-Examples (Python/Rust/Go/C) mit Protokoll-Templates und Restore-Skript Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 19:06:36 +02:00
dschlueter	fb4e96919a	test: Unit-Tests auf 97 erweitern (toolExecutionLabel, getLastAssistantText, SemVer, Flags, ShipVerdict) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 19:06:29 +02:00
dschlueter	7b13c4996d	test: Unit-Tests für normalizeForComparison, parseVerdict, parseBlockers 28 Tests für die drei reinen Hilfsfunktionen aus pi-coder-judge-extension.ts. run-tests.sh führt test-utils.ts ohne ts-node aus (sed-basiertes TS→JS-Stripping). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 18:14:03 +02:00
dschlueter	cba70b67a1	docs: neue Flags, Quick-Judge und parallele Server-Checks dokumentiert - --no-tests und --approve-concerns in Syntax, Beschreibungen und Beispielen - Quick-Check für Runde 1 im Ablaufbeispiel erklärt - --continue: Hinweis auf parallele Server-Bereitschaftsprüfung - Abschnitt 11 (Anwendungsfälle): neue Beispiele für --no-tests / --approve-concerns - CLAUDE.md: currentModelKey-Cache, normalizeForComparison, quickJudgePrompt dokumentiert Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 18:08:00 +02:00
dschlueter	482d98fb63	perf: Quick-Judge Runde 1, switchModel-Cache, Blocker-Normalisierung + weitere TAT-Optimierungen A) quickJudgePrompt()/quickJudgeWithTestsPrompt(): Runde 1 ohne --continue nutzt einen kompakten Prompt ohne TASK.md — spart 15-30% Inference-Zeit bei direktem PASS B) switchModel()-Caching via currentModelKey: Überspringt setModel() wenn Modell bereits korrekt gesetzt ist; currentModelKey wird im finally-Block resettet C) normalizeForComparison() für Loop-Detection: Whitespace/Satzzeichen-Normalisierung verhindert False-Negatives bei minimalen Formulierungsunterschieden im Judge-Output D) Parallele Server-Bereitschaftsprüfung im --continue-Modus via Promise.all: Spart bis zu 3 min bei Kaltstart beider Server E) --no-tests Flag: überspringt detectTestCommands() und autoTestCmds-Befüllung F) --approve-concerns Flag: behandelt "PASS WITH CONCERNS" wie "PASS" (kein ShipIt-Call) H) sendAndWait() settle-Delay 400ms → 150ms: ~1-2 s weniger Wartezeit pro Durchlauf Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 18:03:56 +02:00
dschlueter	11ac46e565	feat: --interactive-Checkpoint, direktes SHIP bei PASS, default rounds 2 - /optimize --interactive pausiert nach erstem PASS; /continue setzt fort, /continue "Zusatz" hängt weiteren Auftrag an und wiederholt den Judge-Loop - Klares PASS → direkt SHIP ohne zweiten ShipIt-Inference-Call (1-3 min gespart) - PASS WITH CONCERNS → ShipIt-Runde weiterhin als finale Abwägung - Default --rounds 3→2 (~30 % schnellere Durchläufe für typische Tasks) - /continue-Command erkennt interactivePauseActive und leitet Signal weiter - Alle drei Interactive-Zustandsvariablen werden im finally-Block resettet - Dokumentation (README, BEDIENUNGSANLEITUNG, CLAUDE.md) vollständig aktualisiert Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 17:51:54 +02:00
dschlueter	5dee5f25e4	feat: Erfolgsmeldung + Auto-Commit nach SHIP Nach SHIP-Verdikt (sowohl in /optimize als auch /shipit): - autoCommitIfDirty(): committet uncommitted Änderungen via git add -A + commit, falls der LLM keinen abschließenden Commit gemacht hat (Sicherheitsnetz) - notifyShipSuccess(): zeigt prominente Meldung "✅ Fertig! Das Programm ist jetzt produktionsreif und committed." Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-23 01:36:02 +02:00
dschlueter	8aadb317e5	docs: /version, Live-Status, korrekte Serverparameter in Doku - README: /version, /plan, /continue, /cancel in Kommando-Tabelle ergänzt - README: --test-cmd/--test-timeout für /optimize dokumentiert - README: Live-Aktivitätsstatus-Tabelle mit Beispielen - README: Serverparameter korrigiert: -c 262144, -n 16384, --cache-type q4_0 - README: VRAM-Tabelle auf q4_0-Basis aktualisiert (256K-Zeile ergänzt) - BEDIENUNGSANLEITUNG: neuer Abschnitt 9 "Versionsverwaltung: /version" - BEDIENUNGSANLEITUNG: Dialog-Beispiele + Manifest-Update-Logik erklärt - BEDIENUNGSANLEITUNG: Live-Status-Hinweis in /optimize-Ablauf integriert - BEDIENUNGSANLEITUNG: Versionsbeispiel in Typische Anwendungsfälle Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-23 00:23:23 +02:00
dschlueter	e13e9382ff	feat: automatische SemVer-Versionierung nach SHIP + /version-Command Neuer /version-Command und automatischer Trigger nach SHIP-Verdikt in /optimize: - getCurrentVersion() liest höchsten vX.Y.Z-Tag (git tag -l \| sort -V) - analyzeBumpType() klassifiziert Commits (feat! → major, feat: → minor, fix: → patch) - detectVersionFile() findet package.json / Cargo.toml / pyproject.toml / VERSION - applyVersionBump() schreibt Version in Manifest + chore-Commit - runVersionBump() zeigt ctx.ui.select()-Dialog mit empfohlenem Bump-Typ Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-22 23:49:53 +02:00
dschlueter	a6f7f968b5	fix: Test-Timeout verhindert hängenden Loop runTestsParallel() wrappte jede Test-Suite mit 'timeout N bash -c ...' (Standard: 120s). Exit 124 wird als Timeout erkannt und im Output markiert. Neues Flag --test-timeout N für Integration-Tests die länger brauchen: /optimize "..." --test-timeout 300 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 23:47:06 +02:00
dschlueter	14c47ecd01	fix: sendAndWait-Retry + Judge-Server-Bereitschaftscheck vor Loop - sendAndWait(): fängt "Agent is already processing" mit exponentiellem Backoff ab (5 Versuche: 500ms, 1s, 2s, 4s). Race Condition zwischen waitForIdle() und sendUserMessage() wird damit toleriert. - /optimize: prüft Port 8002 vor dem Loop (20× alle 3s = max. 60s). Bei 503 "Loading model" wird gewartet statt sofort zu scheitern. Ist der Server nach 60s nicht erreichbar: Abbruch mit Hinweis. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 21:44:37 +02:00
dschlueter	2c07fb9d1c	feat: automatische Test-Erkennung + parallele Ausführung in /optimize Tests werden jetzt von der Extension selbst erkannt und als parallele CPU-Prozesse gestartet — Judge bekommt den fertigen Output und führt keine Tests mehr selbst aus. - detectTestCommands(): erkennt pytest, npm test, cargo, go test, make test anhand von Framework-Markern (alle Checks parallel via Promise.all) - runTestsParallel(): startet alle erkannten Suiten gleichzeitig, kombiniert Output mit Status-Header pro Suite (max. 6000 Zeichen gesamt) - /optimize: Auto-Erkennung läuft einmalig nach Coder-Phase, vor dem Loop - --test-cmd bleibt als Override für Sonderfälle erhalten - Fallback: kein Framework erkannt → Judge führt Tests wie bisher selbst aus Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 21:39:21 +02:00
dschlueter	d5a2c10fa6	fix: --test-cmd in finalNotify-Widget ergänzt Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 21:14:01 +02:00
dschlueter	6afcd6a271	feat: --test-cmd für /optimize — Tests laufen in Extension, nicht im Judge Neues Flag: /optimize <auftrag> --test-cmd "pytest -x" Die Extension führt den Test-Befehl vor jedem Judge-Call selbst aus (pi.exec). Judge bekommt den Output fertig übergeben und muss keine Tests mehr starten. Das entkoppelt Test-Laufzeit vom LLM-Call und spart Judge-Inferenz-Zeit. - judgeWithTestsPrompt(): wie judgePrompt, aber mit Test-Output im Prompt, explizites Verbot weitere Tests zu starten - runTests(): führt Shell-Befehl aus, kürzt Output auf 6000 Zeichen - Ohne --test-cmd: bisheriges Verhalten unverändert Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 21:10:25 +02:00
dschlueter	0fb0ec9e5d	fix: /optimize --continue schreibt Zusatzauftrag in TASK.md Wenn --continue mit einem Auftragstext kombiniert wird, wurde writeTaskMd() bisher nicht aufgerufen — der Text wurde ignoriert. Jetzt wird er als Zusatzauftrag angehängt, bevor die Judge→Fix-Schleife startet. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 21:07:16 +02:00
dschlueter	8bdf73b4ce	docs: CLAUDE.md — Architektur, Deploy-Workflow, GPU-Setup Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 20:03:34 +02:00
dschlueter	4a31535b76	feat: /plan, /cancel, /continue, /discard + Context 262144 + KV-Cache q4_0 - Neue Befehle: /plan (Planungsmodus, nur PLAN.md), /cancel (Loop-Abbruch), /continue (Resume nach Unterbrechung), /discard (PLAN.md verwerfen) - contextWindow in models.json und llama.cpp-Servern: 131072 → 262144 - KV-Cache: q8_0 → q4_0 (weniger VRAM, passt zu 262k-Kontext auf 2× 3090) - parallel: 2 → 1 beim Coder (stabiler bei großem Kontext) - Optimize-Status mit ASCII-Fortschrittsbalken + Blocker-Preview - cancelRequested-Flag prüft nach jedem Loop-Schritt Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-20 20:02:20 +02:00
dschlueter	b19c189e2e	feat: prominente Abschluss-Notifications + Widget-Update für /optimize und /shipit	2026-05-20 02:08:09 +02:00
dschlueter	7cb299ff66	feat: /optimize --continue überspringt Implementierungsphase	2026-05-20 01:42:26 +02:00
dschlueter	aa00a8282e	fix: Judge contextWindow in models.json auf 131072 korrigiert	2026-05-20 01:27:52 +02:00
dschlueter	1da712f0b8	fix: Judge-Kontext auf 131072 erhöht (war 65536, zu klein bei langen Optimize-Runden)	2026-05-20 01:20:07 +02:00
dschlueter	120f223c9b	docs: umfassende README + BEDIENUNGSANLEITUNG mit llama.cpp-Parametern und Beispielen	2026-05-19 21:22:02 +02:00
dschlueter	8dddd0eabd	docs: start-servers.sh in README ergänzt	2026-05-19 19:11:15 +02:00
dschlueter	da961e65f6	feat: start-servers.sh startet Coder und Judge parallel	2026-05-19 19:05:29 +02:00
dschlueter	59b16059cc	feat: stop-servers.sh, status.sh, README.md	2026-05-19 18:57:31 +02:00
dschlueter	6c128f5cf6	fix: install.sh kopiert statt Symlinks zu setzen	2026-05-19 18:51:07 +02:00
dschlueter	4074e10c1a	chore: init pi_coder repository Pi agent extension, model config, and LLaMA server startup scripts for the coder/judge workflow (ports 8001/8002).	2026-05-19 18:21:34 +02:00

28 commits