43 lines
1.4 KiB
Markdown
43 lines
1.4 KiB
Markdown
|
|
# Testkorpus — Pi Text-Agent Fact-Checker
|
||
|
|
|
||
|
|
Jeder Fall enthält einen Artikel mit mindestens einem bekannten Fehler und 2+ korrekten Fakten.
|
||
|
|
|
||
|
|
## Struktur
|
||
|
|
|
||
|
|
```
|
||
|
|
case_XXX/
|
||
|
|
├── input.txt ← Artikel mit bekannten Fehlern
|
||
|
|
├── expected.json ← Erwartete Claim-Status (claim_text → status)
|
||
|
|
└── notes.md ← Was falsch ist und warum
|
||
|
|
```
|
||
|
|
|
||
|
|
## expected.json Format
|
||
|
|
|
||
|
|
```json
|
||
|
|
{
|
||
|
|
"claims": [
|
||
|
|
{
|
||
|
|
"text_contains": "Wort oder Phrase zur Identifikation des Claims",
|
||
|
|
"expected_status": "contradicted | supported | mixed | insufficient_evidence",
|
||
|
|
"note": "Kurze Begründung"
|
||
|
|
}
|
||
|
|
]
|
||
|
|
}
|
||
|
|
```
|
||
|
|
|
||
|
|
`text_contains` wird case-insensitiv als Substring gesucht.
|
||
|
|
|
||
|
|
## Fälle
|
||
|
|
|
||
|
|
| Nr | Thema | Fehler |
|
||
|
|
|----|-------|--------|
|
||
|
|
| 001 | Deutsche Inflation 2024 | Falsche Rate (3,2% statt 2,2%) |
|
||
|
|
| 002 | EZB Leitzins | Falscher Zeitpunkt (April statt Juni) |
|
||
|
|
| 003 | Mondlandung Apollo | Enthält korrekten Fakt |
|
||
|
|
| 004 | Bevölkerung Deutschland | Falsche Zahl (90 Mio statt ~84 Mio) |
|
||
|
|
| 005 | Erneuerbare Energien Deutschland 2023 | Falscher Anteil (70% statt ~59%) |
|
||
|
|
| 006 | Bitcoin Allzeithoch 2021 | Falscher Betrag ($75.000 statt ~$68.000) |
|
||
|
|
| 007 | COVID Impfstoff Zulassung | Richtiger Fakt |
|
||
|
|
| 008 | Bundeshaushalt 2024 | Falscher Betrag (500 Mrd statt ~476 Mrd) |
|
||
|
|
| 009 | Klimaziel Paris | Korrekte Kernaussage |
|
||
|
|
| 010 | Weltbevölkerung | Falsche Zahl (9 Mrd statt ~8,1 Mrd) |
|