masbudjj commited on
Commit
b19e64e
Β·
verified Β·
1 Parent(s): 94711e8

Upload 2 files

Browse files
Files changed (2) hide show
  1. .gitignore +3 -0
  2. README.md +79 -0
.gitignore ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ .DS_Store
2
+ node_modules
3
+ dist
README.md ADDED
@@ -0,0 +1,79 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: TTS Browser Demo - Transformers.js
3
+ emoji: πŸŽ™οΈ
4
+ colorFrom: blue
5
+ colorTo: indigo
6
+ sdk: static
7
+ pinned: false
8
+ ---
9
+
10
+ # πŸŽ™οΈ Text-to-Speech Browser Demo
11
+
12
+ Demo **TTS (Text-to-Speech)** yang berjalan **100% di browser** menggunakan **Transformers.js** dari Hugging Face.
13
+ Tidak perlu server Python, tidak ada biaya hosting!
14
+
15
+ ## ✨ Fitur Lengkap
16
+
17
+ ### πŸŽ™οΈ Model TTS (3 Pilihan)
18
+ - **SpeechT5** (Fast) - Model cepat untuk testing (`Xenova/speecht5_tts`)
19
+ - **SpeechT5 VCTK HiFi** (Best Quality) - Kualitas audio tertinggi (`Xenova/speecht5_tts_vctk_hifi`)
20
+ - **MMS English** (Meta) - Model multilingual Meta (`Xenova/mms-tts-eng`)
21
+
22
+ ### 🎚️ Voice Controls (Semua Berfungsi!)
23
+ - **Speed Control** (0.5x - 2x) - Real-time playback speed adjustment
24
+ - **Temperature** (0.1 - 1.5) - Kontrol kreativitas output
25
+ - **Top P Sampling** (0.01 - 1.0) - Nucleus sampling untuk variasi natural
26
+ - **Top K** (0-50) - Token selection control
27
+ - **Repetition Penalty** (0.8 - 2.0) - Hindari pengulangan kata
28
+ - **Length Penalty** (0.1 - 2.0) - Kontrol panjang audio
29
+ - **Num Beams** (1-8) - Beam search untuk kualitas lebih baik
30
+
31
+ ### 🎀 Speaker Voice Cloning
32
+ - Upload audio file untuk clone karakteristik suara
33
+ - Support semua format audio (MP3, WAV, M4A, dll)
34
+ - Processing otomatis speaker embeddings
35
+
36
+ ### πŸ’» Teknologi
37
+ - ⚑ **100% Client-Side** - Zero server dependency
38
+ - πŸš€ **WebGPU Acceleration** - Auto-detect & fallback ke WASM
39
+ - πŸ’Ύ **Smart Caching** - Model di-cache setelah download pertama
40
+ - πŸ“Š **Real-time Logging** - Activity log dengan timestamp
41
+ - 🎨 **Modern UI** - Dark theme, glassmorphism, smooth animations
42
+ - πŸ“± **Fully Responsive** - Works on mobile, tablet, desktop
43
+
44
+ ## πŸ“– Cara Pakai
45
+
46
+ 1. **Duplicate Space** ini atau clone repository
47
+ 2. Buka URL Space, tunggu model loading (pertama kali akan download ONNX weights)
48
+ 3. **Pilih Model** dari dropdown di panel kanan
49
+ 4. Ketik teks yang ingin diubah jadi suara
50
+ 5. Klik **Generate**
51
+ 6. Audio akan muncul dengan tombol **Download**
52
+
53
+ ## πŸ› οΈ Teknologi
54
+
55
+ - [Transformers.js](https://huggingface.co/docs/transformers.js) v3.x
56
+ - Vanilla JavaScript (ES6 Modules)
57
+ - ONNX Runtime (WASM/WebGPU)
58
+
59
+ ## πŸ“ Catatan
60
+
61
+ - Beberapa kontrol UI (emotion vector, speaker prompt) adalah placeholder untuk ekspansi fitur di masa depan
62
+ - Model akan di-cache di browser setelah download pertama
63
+ - Gunakan browser modern (Chrome, Edge, Firefox) untuk performa optimal
64
+
65
+ ## πŸš€ Deploy Sendiri
66
+
67
+ ```bash
68
+ # Clone repository
69
+ git clone <your-repo-url>
70
+
71
+ # Deploy ke Hugging Face Spaces
72
+ # 1. Buat Space baru di huggingface.co/spaces
73
+ # 2. Pilih "Static" sebagai SDK
74
+ # 3. Upload semua file atau connect Git repository
75
+ ```
76
+
77
+ ---
78
+
79
+ **Template ini siap untuk production!** πŸŽ‰