0qwpifs commited on
Commit
295efc0
·
verified ·
1 Parent(s): d3a0fa0

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +28 -0
README.md ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # 🎤 Diff_Ai05_Whisper_PPG_Large_V2_4.1_FULL
2
+
3
+ Это высокоточная модель голоса, обученная на базе архитектуры **SO-VITS-SVC 4.1 Reflow**. Модель создана для передачи максимально естественного, мягкого и «живого» тембра (лирический тенор), сохраняя все микро-интонации и воздух (субтон).
4
+
5
+ ### 🛠 Спецификации модели:
6
+ * **Энкодер:** Whisper PPG Large V2 (1280 dimensions) — обеспечивает максимальную детализацию звука.
7
+ * **Архитектура:** 4.1 Stable / Reflow.
8
+ * **Шаги обучения:** 30,400 шагов.
9
+ * **Learning Rate (LR):** Ювелирная полировка на `0.00001` (1e-05) после 15,200 шагов.
10
+ * **Датасет:** 1,259 очищенных высококачественных файлов (высокий лирический тенор).
11
+
12
+ ### 💎 Золотой пресет (Рецепт идеального звука):
13
+ Для достижения того самого «живого» и «милого» звучания без пластика, рекомендуется использовать следующие настройки при инференсе:
14
+
15
+ 1. **Index Rate:** `0.45` - `0.55` (это золотая середина для этой модели).
16
+ 2. **Feature Retrieval Index:** Обязательно используйте приложенный файл `.pkl` (51 MB).
17
+ 3. **HACK (k-neighbors):** Для максимальной плотности («мяса») и мягкости воздуха рекомендуется пропатчить инференс на **k=100** соседей (вместо стандартных 8).
18
+ 4. **F0 Predictor:** `crepe` (дает самую чистую читку нот для этого тембра).
19
+
20
+ ### 🎼 Особенности звучания:
21
+ Модель идеально справляется с:
22
+ * **Субтоном** (шепот, переходящий в тихий голос).
23
+ * **Высокими нотами** лирического тенора.
24
+ * **Сложной дикцией** (шипящие «ЧШ», «СС», «ТТС» звучат как живые за счет индекса k=100).
25
+
26
+ ---
27
+ **67! ⚖️🔼🔽**
28
+ *Создано с любовью к качеству звука. Беречь как зеницу ока.*