Update README.md
Browse files
README.md
CHANGED
|
@@ -15,22 +15,22 @@ license: cc-by-4.0
|
|
| 15 |
|
| 16 |
Github : https://github.com/SWivid/F5-TTS
|
| 17 |
|
| 18 |
-
|
| 19 |
-
|
| 20 |
-
|
| 21 |
-
|
| 22 |
-
-
|
| 23 |
-
|
| 24 |
-
- ภาษาไทย ประมาณ 190 ชั่วโมง
|
| 25 |
-
- ภาษาอังกฤษ ประมาณ 40 ชัวโมง
|
| 26 |
- ขนาดโมเดลล่าสุด
|
| 27 |
-
-
|
| 28 |
- ภาษาที่รองรับ: ไทย และ อังกฤษ.
|
|
|
|
| 29 |
- การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
|
| 30 |
-
- เสียงตัวอย่างควรมีความยาว
|
| 31 |
-
-
|
| 32 |
-
-
|
| 33 |
-
- ถ้าเสียงต้นฉบับเป็นภาษาอื่นควรเปลี่ยนข้อความต้นฉบับเป็นคำอ่านไทย เช่น Good Morning เป็น
|
|
|
|
| 34 |
|
| 35 |
### การใช้งาน
|
| 36 |
|
|
|
|
| 15 |
|
| 16 |
Github : https://github.com/SWivid/F5-TTS
|
| 17 |
|
| 18 |
+
| ชุดข้อมูล | ระยะเวลา(ชั่วโมง)
|
| 19 |
+
|--------|--------|
|
| 20 |
+
| [Common Voice (Porameht/processed-voice-th-169k)](https://huggingface.co/datasets/Porameht/processed-voice-th-169k) | ~160
|
| 21 |
+
| [Porjai Dataset](CMKL/Porjai-Thai-voice-dataset-central) | ~300
|
| 22 |
+
| Common Voice-EN(อังกฤษ) | ~40
|
| 23 |
+
|
|
|
|
|
|
|
| 24 |
- ขนาดโมเดลล่าสุด
|
| 25 |
+
- 900,000 Steps
|
| 26 |
- ภาษาที่รองรับ: ไทย และ อังกฤษ.
|
| 27 |
+
|
| 28 |
- การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
|
| 29 |
+
- เสียงตัวอย่างควรมีความยาว 2-8 วินาที
|
| 30 |
+
- สามารถลองปรับลดความเร็วเสียงในการสร้าง เช่น 0.8 หรือ กำหนด seed ใหม่, เพื่อให้ได้เสียงที่ถูกต้อง.
|
| 31 |
+
- เสียงและข้อความต้นฉบับควรเป็นภาษาไทย.
|
| 32 |
+
- ถ้าเสียงต้นฉบับเป็นภาษาอื่นควรเปลี่ยนข้อความต้นฉบับเป็นคำอ่านไทย เช่น Good Morning เป็น กูดมอร์นิ่ง.
|
| 33 |
+
- ถ้าเสียงต้นฉบับมีความเร็วในการอ่านมาก ควรลดความเร็ว เหลือ 0.7-0.8
|
| 34 |
|
| 35 |
### การใช้งาน
|
| 36 |
|