2026-05-16 08:56:50 +02:00
|
|
|
# Chatterbox TTS CLI — Abhängigkeiten
|
|
|
|
|
# Getestet mit Python 3.11, CUDA 12.x, Ubuntu 22.04/24.04
|
|
|
|
|
|
|
|
|
|
# TTS-Kern
|
|
|
|
|
chatterbox-tts>=0.1.7
|
|
|
|
|
|
|
|
|
|
# PyTorch (passende CUDA-Version separat installieren, z. B. via pytorch.org)
|
|
|
|
|
torch>=2.6.0
|
|
|
|
|
torchaudio>=2.6.0
|
|
|
|
|
|
|
|
|
|
# Audio-Ausgabe (Linux/PipeWire/PulseAudio)
|
|
|
|
|
sounddevice>=0.4.0
|
|
|
|
|
|
|
|
|
|
# Pitch-erhaltende Zeitstreckung (Geschwindigkeitsanpassung)
|
|
|
|
|
pyrubberband>=0.4.0
|
|
|
|
|
# rubberband-cli muss zusätzlich als Systempakete installiert sein:
|
|
|
|
|
# sudo apt install rubberband-cli
|
Erweiterung: Stop-Mechanismus, REST-Service und MCP-Adapter
- chatterbox_cli_v4.py: kooperativer Stop-Mechanismus via threading.Event
(STOP_REQUESTED, request_stop, clear_stop); PlaybackWorker, synthesize_non_streaming
und synthesize_streaming prüfen das Event vor jedem Chunk; --stop CLI-Flag
- tts_service.py: FastAPI-Service mit Modell-Caching, Job-Queue und Worker-Thread;
Endpunkte: POST /speak, POST /stop, GET /health, GET /status, GET /voices
- mcp_adapter.py: MCP-Adapter (stdio/streamable-http) über tts_service; Tools:
speak, stop, get_status, list_voices
- requirements.txt: fastapi, uvicorn, httpx, mcp ergänzt
- CLAUDE.md: Architektur und Startbefehle dokumentiert
- .gitignore: Ideen/-Verzeichnis ausgeschlossen
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-16 09:46:43 +02:00
|
|
|
|
|
|
|
|
# HTTP-Service (Phase 2)
|
|
|
|
|
fastapi>=0.115.0
|
|
|
|
|
uvicorn[standard]>=0.32.0
|
|
|
|
|
|
|
|
|
|
# HTTP-Client für MCP-Adapter (Phase 3)
|
|
|
|
|
httpx>=0.28.0
|
|
|
|
|
|
|
|
|
|
# MCP-Adapter (Phase 3)
|
|
|
|
|
mcp>=1.0.0
|