Vollständiges Multi-Agenten-System für Fact-Checking, Artikelschreiben und Argumentationsanalyse. Zwei Backends: llama.cpp (★ bevorzugt) und Ollama. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com> |
||
|---|---|---|
| .. | ||
| case_001 | ||
| case_002 | ||
| case_003 | ||
| case_004 | ||
| case_005 | ||
| case_006 | ||
| case_007 | ||
| case_008 | ||
| case_009 | ||
| case_010 | ||
| README.md | ||
Testkorpus — Pi Text-Agent Fact-Checker
Jeder Fall enthält einen Artikel mit mindestens einem bekannten Fehler und 2+ korrekten Fakten.
Struktur
case_XXX/
├── input.txt ← Artikel mit bekannten Fehlern
├── expected.json ← Erwartete Claim-Status (claim_text → status)
└── notes.md ← Was falsch ist und warum
expected.json Format
{
"claims": [
{
"text_contains": "Wort oder Phrase zur Identifikation des Claims",
"expected_status": "contradicted | supported | mixed | insufficient_evidence",
"note": "Kurze Begründung"
}
]
}
text_contains wird case-insensitiv als Substring gesucht.
Fälle
| Nr | Thema | Fehler |
|---|---|---|
| 001 | Deutsche Inflation 2024 | Falsche Rate (3,2% statt 2,2%) |
| 002 | EZB Leitzins | Falscher Zeitpunkt (April statt Juni) |
| 003 | Mondlandung Apollo | Enthält korrekten Fakt |
| 004 | Bevölkerung Deutschland | Falsche Zahl (90 Mio statt ~84 Mio) |
| 005 | Erneuerbare Energien Deutschland 2023 | Falscher Anteil (70% statt ~59%) |
| 006 | Bitcoin Allzeithoch 2021 | Falscher Betrag ($75.000 statt ~$68.000) |
| 007 | COVID Impfstoff Zulassung | Richtiger Fakt |
| 008 | Bundeshaushalt 2024 | Falscher Betrag (500 Mrd statt ~476 Mrd) |
| 009 | Klimaziel Paris | Korrekte Kernaussage |
| 010 | Weltbevölkerung | Falsche Zahl (9 Mrd statt ~8,1 Mrd) |