Text_Agent/tests/corpus/README.md

43 lines
1.4 KiB
Markdown
Raw Normal View History

# Testkorpus — Pi Text-Agent Fact-Checker
Jeder Fall enthält einen Artikel mit mindestens einem bekannten Fehler und 2+ korrekten Fakten.
## Struktur
```
case_XXX/
├── input.txt ← Artikel mit bekannten Fehlern
├── expected.json ← Erwartete Claim-Status (claim_text → status)
└── notes.md ← Was falsch ist und warum
```
## expected.json Format
```json
{
"claims": [
{
"text_contains": "Wort oder Phrase zur Identifikation des Claims",
"expected_status": "contradicted | supported | mixed | insufficient_evidence",
"note": "Kurze Begründung"
}
]
}
```
`text_contains` wird case-insensitiv als Substring gesucht.
## Fälle
| Nr | Thema | Fehler |
|----|-------|--------|
| 001 | Deutsche Inflation 2024 | Falsche Rate (3,2% statt 2,2%) |
| 002 | EZB Leitzins | Falscher Zeitpunkt (April statt Juni) |
| 003 | Mondlandung Apollo | Enthält korrekten Fakt |
| 004 | Bevölkerung Deutschland | Falsche Zahl (90 Mio statt ~84 Mio) |
| 005 | Erneuerbare Energien Deutschland 2023 | Falscher Anteil (70% statt ~59%) |
| 006 | Bitcoin Allzeithoch 2021 | Falscher Betrag ($75.000 statt ~$68.000) |
| 007 | COVID Impfstoff Zulassung | Richtiger Fakt |
| 008 | Bundeshaushalt 2024 | Falscher Betrag (500 Mrd statt ~476 Mrd) |
| 009 | Klimaziel Paris | Korrekte Kernaussage |
| 010 | Weltbevölkerung | Falsche Zahl (9 Mrd statt ~8,1 Mrd) |