File size: 6,549 Bytes
f4b194d
 
 
21dab78
 
 
 
f4b194d
35e3d97
8b2eb05
e446f48
d0c01a8
35e3d97
56f9d49
854b7fd
 
 
a17fa0e
 
cb5b974
56f9d49
6a1f715
56f9d49
02fd751
56f9d49
6a1f715
cb5b974
6a1f715
56f9d49
 
 
 
 
 
857ec32
56f9d49
5640edc
2016c03
56f9d49
 
2f5716f
56f9d49
6a1f715
56f9d49
8b2eb05
2f5716f
8b2eb05
 
 
 
 
 
 
47cca52
8b2eb05
 
 
56f9d49
 
 
 
 
6a1f715
8b2eb05
56f9d49
 
 
8d76648
 
 
 
 
 
e987092
 
 
 
 
 
 
 
 
 
 
 
56f9d49
a17fa0e
56f9d49
6a1f715
857ec32
a2132cf
 
 
 
21163a5
a2132cf
 
4a9d677
 
1d3b2cd
 
4a9d677
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
---
language:
- ru
---

✅ Этот проект заброшен и больше не будет обновляться

---
# ПОЖАЛУЙСТА ПРОЧИТАЙТЕ ЭТОТ РАЗДЕЛ! ТУТ ВАЖНАЯ ИНФОРМАЦИЯ, ОТ КОТОРОЙ ЗАВИСИТ РАБОТА RVC!
это mangio_rvc-v2 с easygui, tensorboard, с тренировкой, realtime gui, и все это работает из коробки.
# это строго для пользователей Nvidia серии 10xx и выше.

# ВНИМАНИЕ! ПУТЬ К ПРОГРАММЕ ДОЛЖЕН БЫТЬ НА АНГЛИСКОМ ЯЗЫКЕ!! ИМЯ КОМПЬЮТЕРА ТОЖЕ СТРОГО НА АНГЛИЙСКОМ

А так же, не используйте поиск Windows для поиска файлов, иначе у вас могут быть непонятные ошибки.
____

# Как это использовать

Зависит от того что вам требуется. 

[Замена голоса в аудиокомпозиции](#заменяем-голос-в-аудиокомпозиции)

[Тренировка модели на своем ПК](#тренировка-голосовых-моделей-на-своем-пк)

[Подмена голоса в реальном временем (Voice changer)](#оглавление)

[Исправление ошибок (траблшутинг)](#исправление-проблем)
###### Текст чуть выше кликакабельный.

____

# Подготовка

1. [Скачиваем zip архив отсюда](https://huggingface.co/dh2fun/rvc_v2_completed/resolve/main/rvc_v2.zip)
2. Распаковываем в папку (по возможности в корень диска C:\)
3. Запускаем !rvc_v2_preloader.exe и выбираем папку куда мы распаковали rvc.
4. Нажимаем на кнопку "Запуск RVC EasyGUI"
5. Ждем пару минут и у нас откроется браузер.
6. Поздравляю. Если у вас в браузере что-то появилось, то всё работает.
7. Вы можете добавить модели [нажав сюда](#добавляем-голосовые-модели-в-rvc)

Если что-то не так то жду вас в [решение проблем](#решение-проблем)

____
# Добавляем голосовые модели в rvc
1. Большинство моделей можно найти тут:[AiHub (Discord)](https://discord.gg/aihub)
2. Заходим в канал voice-models
3. Практически все модели подходят к нашей программе. Пишем в поиск нужную (Желательно по англиски) и скачиваем
4. После того как скачали, в архиве должно быть 2 файла, это .pth и .index
5. Перемещаем .pth в папку "weights". Эта та самая папка, куда вы распаковали саму rvc.
![пример папки](https://cdn.discordapp.com/attachments/1121884700521283756/1151461083404582953/image.png)
6. Дальше, заходим в папку logs, создаем папку с названием модели которую мы скачали, и перемещаем туда .index
![пример папки2](https://cdn.discordapp.com/attachments/1121884700521283756/1151463869642969148/image.png)
7. Возвращаемся в браузер, убеждаемся что вы во вкладке "Inference", затем нажимаем "Refresh" которая находится у "1.Choose your Model."
8. Модель появилась? Ура. Если не появилась, то [нажмите сюда](#исправление-проблем)
9. Не забудьте выбрать свой .index в "Index Settings" он должен совпадать по названию с ".pth", не обязательно слово в слово.
____

# Заменяем голос в аудиокомпозиции


1. Выполяем все шаги [тут](#подготовка)
2. 

____


# Тренировка голосовых моделей на своем ПК
1. Выполяем все шаги [тут](#подготовка)
2. дальше мне лень писать
3. 

требования к нормальному датасету:
1. отсутствие шумов, кликов мыши/клавиатуры, тишины и прочего
2. примерная длина всех аудио от 1 до 30 минут, оптимальное от 3 до 10
3. для удобства советую разделить на файлы, можно и произвольной длины

*датасет - набор данных для тренироки.

требования к тренировке:
1. не допускать перетренировки
2. не допускать слабого обучения
3. смотреть на графики tensorboard, чтобы найти идеальное количество эпох

____

# Изменяем голос в реальном времени
1. Выполяем все шаги [тут](#подготовка)
2. Скачиваем и устанавливаем VAC (Virtual Audio Cable) --> [тут](https://huggingface.co/dh2fun/rvc_v2_completed/resolve/main/VBCABLE_Driver_Pack43.zip)
3. Открываем VBCABLE_Setup_x64.exe и устанавливаем.
4. Нас попросят перезагрузить ПК, но мы не будем.
5. 

____
# Исправление проблем

а

____

# Структура папок/файлов модели RVC v2 выглядит следующим образом:

папка eval - используется для хранения оценок для tensorboard, если они поддерживаются в данном случае

файл fevents - это файл тензорборда / графика

некоторые файлы журналов .txt и config - журналы и конфигурации

G_xxxxx.pth файл ( генератор )

D_xxxxx.pth файл ( дискриминатор )

fea.npy (большой файл, содержащий характеристики модели / голоса)

trained index (файл, который мы больше не используем)