Piper TTS — Bass (pl_PL)
Polski model TTS oparty na architekturze VITS (Piper TTS), fine-tuned na polskich nagraniach mowy.
Pliki modelu
| Plik | Opis |
|---|---|
bass.onnx |
Model inference (ONNX, 61 MB) |
bass.onnx.json |
Konfiguracja modelu |
epoch=5999-step=1541560.ckpt |
Checkpoint PyTorch Lightning (do dalszego treningu) |
Parametry treningu
- Jakość: medium (22050 Hz, 256 filtrów)
- Epoki: 6000 (fine-tuning od pl_PL-darkman-medium)
- Dataset: ~10 000 segmentów polskiej mowy
- GPU: AMD RX 9070 XT (ROCm 7.2)
- Framework: PyTorch 2.10 + PyTorch Lightning
Użycie z Piper
# Instalacja
pip install piper-tts
# Synteza
echo "Życie musi trwać." | piper \
--model bass.onnx \
--output_file output.wav
Użycie z Home Assistant (Wyoming TTS)
Skopiuj bass.onnx i bass.onnx.json do katalogu modeli Piper w Home Assistant.
Użycie z Python
from piper import PiperVoice
voice = PiperVoice.load("bass.onnx", config_path="bass.onnx.json")
with open("output.wav", "wb") as f:
voice.synthesize("Witaj świecie!", f)
Licencja
Model bazowy (darkman_medium): Apache 2.0.
- Downloads last month
- 14
Model tree for blackbartblues/piper-pl-bass
Base model
rhasspy/piper-voices