|
|
--- |
|
|
language: |
|
|
- th |
|
|
pipeline_tag: text-to-speech |
|
|
base_model: |
|
|
- SWivid/F5-TTS |
|
|
--- |
|
|
|
|
|
#### F5-TTS-ไทย-V2 |
|
|
|
|
|
โมเดล Text To Speech ภาษาไทย V2 โดยใช้ phoneme เป็นข้อความอินพุต เพื่อลดความพิดพลาดในการอ่าน แต่อาาจะลดความเป็นธรรมชาติลง |
|
|
|
|
|
### การใช้งาน |
|
|
|
|
|
[Github](https://github.com/VYNCX/F5-TTS-THAI) |
|
|
|
|
|
ติดตั้ง |
|
|
|
|
|
```sh |
|
|
pip install f5-tts-th |
|
|
|
|
|
#จำเป็นต้องติดตั้งเพื่อใช้งานได้มีประสิทธิภาพกับ GPU |
|
|
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124 |
|
|
``` |
|
|
|
|
|
ใช้งาน |
|
|
|
|
|
```sh |
|
|
from f5_tts_th.tts import TTS |
|
|
import soundfile as sf |
|
|
|
|
|
tts = TTS(model="v2") |
|
|
|
|
|
wav = tts.infer( |
|
|
ref_audio="YOUR_AUDIO_PATH", |
|
|
ref_text="ได้รับข่าวคราวของเราที่จะหาที่มันเป็นไปที่จะจัดขึ้น.", |
|
|
gen_text="สวัสดีครับ นี่คือเสียงพูดภาษาไทย.", |
|
|
step=32, |
|
|
cfg=2.0, |
|
|
speed=1.0 |
|
|
) |
|
|
|
|
|
sf.write("test.wav", wav, 24000) |
|
|
``` |