Spaces:

pythonlearnreal
/

F5-TTS-THAI

Sleeping

App Files Files Community

F5-TTS-THAI / deployment /README.md

pythonlearnreal

Upload folder using huggingface_hub

106478e verified 5 months ago

preview code

raw

history blame contribute delete

4.62 kB

A newer version of the Gradio SDK is available: 6.1.0

Upgrade

metadata

title: F5-TTS Thai
emoji: 🎤
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
python_version: 3.1
hardware: cpu-basic
short_description: Zero-shot Text-to-Speech for Thai language

F5-TTS ภาษาไทย 🎤

Zero-shot Text-to-Speech สำหรับภาษาไทย ด้วยโมเดล F5-TTS

✨ Features

Multi-Speech Generation: สร้างเสียงพูดหลายสไตล์ในไฟล์เดียว
Voice Cloning: โคลนเสียงจากไฟล์ตัวอย่างสั้นๆ
Thai Language Support: รองรับภาษาไทยอย่างเต็มรูปแบบ
Real-time Processing: ประมวลผลแบบ real-time
Segment Editing: แก้ไขและปรับแต่งเสียงแต่ละส่วนได้

🚀 วิธีใช้งาน

Multi-Speech Generation

เพิ่มประเภทคำพูด: คลิก "เพิ่มประเภทคำพูด" เพื่อเพิ่มสไตล์เสียงใหม่
อัปโหลดเสียงตัวอย่าง: อัปโหลดไฟล์เสียงสำหรับแต่ละสไตล์
ใส่ข้อความต้นฉบับ: พิมพ์ข้อความที่สอดคล้องกับเสียงตัวอย่าง
เขียนสคริปต์: ใช้รูปแบบ {ชื่อสไตล์} ข้อความที่จะพูด

ตัวอย่างการใช้งาน

{ปกติ} สวัสดีครับ มีอะไรให้ผมช่วยไหมครับ
{เศร้า} ผมเครียดจริงๆ นะตอนนี้...
{โกรธ} รู้ไหม! เธอไม่ควรอยู่ที่นี่!
{กระซิบ} ฉันมีอะไรจะบอกคุณ แต่มันเป็นความลับนะ

⚙️ Technical Details

Models Used

F5-TTS: Zero-shot text-to-speech model
Vocoder: Neural vocoder for high-quality audio synthesis
Text Processing: Thai text normalization and processing

System Requirements

RAM: อย่างน้อย 4GB (แนะนำ 8GB+)
GPU: ไม่จำเป็น แต่จะช่วยเพิ่มความเร็ว
Storage: ~2GB สำหรับโมเดลและ dependencies

🔧 Configuration

Model Settings

NFE Steps: ควบคุมคุณภาพเสียง (16-64)
Cross Fade Duration: ปรับการต่อเสียงระหว่างส่วน
Speed: ปรับความเร็วการพูด
CFG Strength: ปรับความแข็งแกร่งของ guidance

Tips สำหรับผลลัพธ์ที่ดี

เสียงตัวอย่าง: ใช้เสียงที่ชัดเจน ไม่มีเสียงรบกวน ความยาว 5-10 วินาที
ข้อความต้นฉบับ: ให้ตรงกับเสียงตัวอย่างที่สุด
ข้อความที่จะสร้าง: เว้นวรรคและใส่เครื่องหมายวรรคตอนให้ชัดเจน
การตั้งค่า: เริ่มด้วยค่า default แล้วค่อยปรับแต่ง

🚨 Limitations

รองรับเฉพาะภาษาไทยเป็นหลัก
คุณภาพเสียงขึ้นอยู่กับเสียงตัวอย่าง
ใช้เวลาในการประมวลผลตามความยาวข้อความ
ต้องใช้ internet เพื่อดาวน์โหลดโมเดล

📝 License

MIT License - ใช้งานได้อย่างอิสระ

🤝 Contributing

สามารถมีส่วนร่วมพัฒนาได้ที่ GitHub Repository

🐛 Bug Reports

หากพบปัญหาการใช้งาน กรุณาแจ้งได้ที่ Issues ของ GitHub Repository