|
|
--- |
|
|
license: cc-by-nc-4.0 |
|
|
language: |
|
|
- de |
|
|
- en |
|
|
tags: |
|
|
- text-to-speech |
|
|
- tts |
|
|
- german |
|
|
- voice-cloning |
|
|
- zero-shot |
|
|
- emotional-tts |
|
|
pipeline_tag: text-to-speech |
|
|
--- |
|
|
|
|
|
<p align="center"> |
|
|
<img src="https://huggingface.co/Keyven/German-TTS/resolve/main/logo.png" alt="German-TTS Logo" width="128"> |
|
|
</p> |
|
|
|
|
|
<h1 align="center">German-TTS</h1> |
|
|
|
|
|
<p align="center"> |
|
|
<strong><a href="https://german-tts.de">german-tts.de</a></strong> - Hochoptimiertes deutsches Text-to-Speech System mit Zero-Shot Voice Cloning. |
|
|
</p> |
|
|
|
|
|
[](https://german-tts.de) |
|
|
[](https://github.com/Keyvanhardani/German-TTS) |
|
|
|
|
|
## Features |
|
|
|
|
|
- **Deutsche Sprachsynthese** - Optimiert für native deutsche Aussprache |
|
|
- **Zero-Shot Voice Cloning** - Klone jede Stimme mit 3-10s Audio |
|
|
- **Emotionale Sprache (EN)** - Happy, Sad, Angry, Surprise |
|
|
- **Geschwindigkeitskontrolle** - 0.5x bis 2.0x |
|
|
- **51 Stimmen** - 22 Deutsche + 29 Englische |
|
|
|
|
|
## Schnellstart |
|
|
|
|
|
```python |
|
|
from german_tts import GermanTTS |
|
|
|
|
|
tts = GermanTTS() |
|
|
|
|
|
# Synthese |
|
|
audio = tts.synthesize("Guten Tag! Wie geht es Ihnen?") |
|
|
audio.save("output.wav") |
|
|
|
|
|
# Mit Voice Cloning |
|
|
audio = tts.synthesize( |
|
|
"Das ist ein Test.", |
|
|
reference_audio="stimme.wav", |
|
|
speed=1.0 |
|
|
) |
|
|
``` |
|
|
|
|
|
## Modelle |
|
|
|
|
|
| Datei | Größe | Beschreibung | |
|
|
|-------|-------|--------------| |
|
|
| `german_tts_base.safetensors` | ~1.3 GB | Deutsches Hauptmodell | |
|
|
| `german_tts_dit.pt` | ~1.3 GB | DiT Version | |
|
|
| `german_tts_dit_fp16.pt` | ~650 MB | FP16 (schneller) | |
|
|
| `german_tts_dit_int8.pt` | ~340 MB | INT8 (am schnellsten) | |
|
|
| `vocab.txt` | 2 KB | Vokabular | |
|
|
| `emotional_en/` | ~2.6 GB | Emotionale EN Modelle | |
|
|
|
|
|
## Text-Normalisierung |
|
|
|
|
|
| Eingabe | Ausgabe | |
|
|
|---------|---------| |
|
|
| `10€` | zehn Euro | |
|
|
| `14:30 Uhr` | vierzehn Uhr dreißig | |
|
|
| `Dr. Müller` | Doktor Müller | |
|
|
|
|
|
## Lizenz |
|
|
|
|
|
CC-BY-NC-4.0 (Nicht-kommerziell) |
|
|
|
|
|
Kommerzielle Lizenz: info@keyvan.ai |
|
|
|
|
|
--- |
|
|
Entwickelt von [Keyvan.ai](https://keyvan.ai) |
|
|
|