chatterbox-tts-cli/requirements.txt
dschlueter 34a34907a8 Bugfixes, Verbesserungen und Mixed-Language-Support
Bugfixes:
- Abkürzungen (z.B., d.h., Dr., Prof.) werden nicht mehr als Satzenden erkannt (_ABBREV_MASK_RE)
- Multilingual-Import: except Exception → except (ImportError, ModuleNotFoundError)
- tts_agent: ReAct-Schleife auf max. 10 Iterationen begrenzt, model_dump → explizites Dict
- tts_service: audio_device=None fällt auf 'pulse' zurück
- JSON-Fehlerbehandlung für --pronunciation-dict mit aussagekräftiger Meldung
- PlaybackWorker: Audio-Device wird vor Stream-Start via sd.query_devices() geprüft
- mcp_adapter: Fehlerbehandlung für HTTP-Fehler, Timeout erhöht, session_id ergänzt
- tts_agent: Health-Check beim Start, --speed/--first-chunk-len Validierung

Neue Features:
- Gemischtsprachige Texte: [en]...[/en]-Markierungen für per-Segment language_id
- strip_markdown(): entfernt Markdown-Formatierung vor der Synthese (--no-strip-markdown)
- Emoji-Entfernung in clean_raw_text() via unicodedata
- Pause/Resume: request_pause()/request_resume(), POST /pause, POST /resume, MCP-Tools
- Neue Einheiten: °C, °F, kWh, kW, W, V, A, J, kPa, bar, m², m³, m/s, rpm
- number_to_words_de/en bis Milliarden
- DEFAULT_PRONUNCIATION_DE erweitert (GitHub, YouTube, LinkedIn, Wi-Fi, iPhone, ChatGPT, …)
- NON_SPELLED_ACRONYMS erweitert (USB, CPU, GPU, API, CEO, HTML, …)
- Nummerierte Listen als separate Chunks behandelt
- Modell-Warmup via TTS_PRELOAD_LANG Env-Variable
- requirements.txt: Upper-Bounds für fastapi und uvicorn

Dokumentation: CLAUDE.md, README.md, BEDIENUNGSANLEITUNG.md vollständig aktualisiert

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-06-03 11:36:54 +02:00

29 lines
863 B
Text

# Chatterbox TTS CLI — Abhängigkeiten
# Getestet mit Python 3.11, CUDA 12.x, Ubuntu 22.04/24.04
#
# PyTorch separat installieren (passende CUDA-Version via pytorch.org):
# pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu124
# --- TTS-Kern ---
chatterbox-tts>=0.1.7
# --- Audio-Ausgabe (Linux/PipeWire/PulseAudio) ---
sounddevice>=0.4.0
# --- Pitch-erhaltende Zeitstreckung (--speed != 1.0) ---
# Systempaket zusätzlich erforderlich: sudo apt install rubberband-cli
pyrubberband>=0.4.0
# --- HTTP-Service (tts_service.py) ---
fastapi>=0.115.0,<2.0
uvicorn[standard]>=0.32.0,<1.0
# --- HTTP-Client (mcp_adapter.py → tts_service.py) ---
httpx>=0.28.0
# --- MCP-Adapter (mcp_adapter.py) ---
mcp>=1.0.0
# --- TTS Agent (tts_agent.py) ---
# OpenAI-SDK als universeller Client für Ollama, LM Studio, OpenAI etc.
openai>=1.0.0