VIZINTZOR commited on
Commit
d9796f3
·
verified ·
1 Parent(s): 11a962a

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -13
README.md CHANGED
@@ -15,22 +15,22 @@ license: cc-by-4.0
15
 
16
  Github : https://github.com/SWivid/F5-TTS
17
 
18
- ชุดข้อมูลที่นำไปเทรน
19
- - [Porameht/processed-voice-th-169k](https://huggingface.co/datasets/Porameht/processed-voice-th-169k)
20
- - [Common Voice](https://commonvoice.mozilla.org/)
21
-
22
- - จำนวน
23
- - 200,000 เสียง
24
- - ภาษาไทย ประมาณ 190 ชั่วโมง
25
- - ภาษาอังกฤษ ประมาณ 40 ชัวโมง
26
  - ขนาดโมเดลล่าสุด
27
- - 650,000 Steps
28
  - ภาษาที่รองรับ: ไทย และ อังกฤษ.
 
29
  - การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
30
- - เสียงตัวอย่างควรมีความยาว 5-10 นาที
31
- - สามารถลองสร้าง หรือ กำหนด seed ใหม่ เพื่อให้ได้เสียงที่ถูกต้อง
32
- - เสียงและข้อความต้นฉบับควรเป็นภาษาไทย
33
- - ถ้าเสียงต้นฉบับเป็นภาษาอื่นควรเปลี่ยนข้อความต้นฉบับเป็นคำอ่านไทย เช่น Good Morning เป็น กูดมอร์นิ่ง
 
34
 
35
  ### การใช้งาน
36
 
 
15
 
16
  Github : https://github.com/SWivid/F5-TTS
17
 
18
+ | ชุดข้อมูล | ระยะเวลา(ชั่วโมง)
19
+ |--------|--------|
20
+ | [Common Voice (Porameht/processed-voice-th-169k)](https://huggingface.co/datasets/Porameht/processed-voice-th-169k) | ~160
21
+ | [Porjai Dataset](CMKL/Porjai-Thai-voice-dataset-central) | ~300
22
+ | Common Voice-EN(อังกฤษ) | ~40
23
+
 
 
24
  - ขนาดโมเดลล่าสุด
25
+ - 900,000 Steps
26
  - ภาษาที่รองรับ: ไทย และ อังกฤษ.
27
+
28
  - การอ่านข้อความยาวๆ หรือบางคำ ยังไม่ถูกต้อง
29
+ - เสียงตัวอย่างควรมีความยาว 2-8 วินาที
30
+ - สามารถลองปรับลดความเร็วเสียงในการสร้าง เช่น 0.8 หรือ กำหนด seed ใหม่, เพื่อให้ได้เสียงที่ถูกต้อง.
31
+ - เสียงและข้อความต้นฉบับควรเป็นภาษาไทย.
32
+ - ถ้าเสียงต้นฉบับเป็นภาษาอื่นควรเปลี่ยนข้อความต้นฉบับเป็นคำอ่านไทย เช่น Good Morning เป็น กูดมอร์นิ่ง.
33
+ - ถ้าเสียงต้นฉบับมีความเร็วในการอ่านมาก ควรลดความเร็ว เหลือ 0.7-0.8
34
 
35
  ### การใช้งาน
36