Update README.md
Browse files
README.md
CHANGED
|
@@ -22,6 +22,13 @@ tags:
|
|
| 22 |
* **Learning Rate (LR):** Ювелирная полировка на `0.00001` (1e-05) после 15,200 шагов.
|
| 23 |
* **Датасет:** 1,259 очищенных высококачественных файлов (высокий лирический тенор).
|
| 24 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 25 |
### 💎 Золотой пресет (Рецепт идеального звука):
|
| 26 |
Для достижения того самого «живого» и «милого» звучания без пластика, рекомендуется использовать следующие настройки при инференсе:
|
| 27 |
|
|
@@ -38,4 +45,5 @@ tags:
|
|
| 38 |
|
| 39 |
---
|
| 40 |
**Другие никнеймы создателя: Diff_Ai05 \ 0qwpif \ ii_Senya0**
|
|
|
|
| 41 |
*Создано с любовью к качеству звука.*
|
|
|
|
| 22 |
* **Learning Rate (LR):** Ювелирная полировка на `0.00001` (1e-05) после 15,200 шагов.
|
| 23 |
* **Датасет:** 1,259 очищенных высококачественных файлов (высокий лирический тенор).
|
| 24 |
|
| 25 |
+
### ⚙️ Требования для запуска (ВАЖНО!):
|
| 26 |
+
Чтобы модель звучала корректно и вообще запустилась, в вашей сборке SO-VITS-SVC 4.1 должны быть установлены правильные базовые файлы:
|
| 27 |
+
* **Speech Encoder:** `Whisper PPG Large V2` (Файл `large-v2.pt` должен лежать в папке `pretrain`).
|
| 28 |
+
* **Vocoder:** `nsf-hifigan` (Стандартный вокодер от OpenVPI, должен лежать в `pretrain/nsf_hifigan`).
|
| 29 |
+
|
| 30 |
+
*Без Whisper Large V2 модель выдаст ошибку размерности (1280), а без NSF-HiFiGAN голос потеряет свою мягкость.*
|
| 31 |
+
|
| 32 |
### 💎 Золотой пресет (Рецепт идеального звука):
|
| 33 |
Для достижения того самого «живого» и «милого» звучания без пластика, рекомендуется использовать следующие настройки при инференсе:
|
| 34 |
|
|
|
|
| 45 |
|
| 46 |
---
|
| 47 |
**Другие никнеймы создателя: Diff_Ai05 \ 0qwpif \ ii_Senya0**
|
| 48 |
+
|
| 49 |
*Создано с любовью к качеству звука.*
|