mason369 commited on
Commit
2344a28
·
verified ·
1 Parent(s): ba160a2

Upload README_HF.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README_HF.md +151 -0
README_HF.md ADDED
@@ -0,0 +1,151 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: AI-RVC 语音转换 & AI 翻唱
3
+ emoji: 🎤
4
+ colorFrom: blue
5
+ colorTo: purple
6
+ sdk: gradio
7
+ sdk_version: 3.50.2
8
+ app_file: app.py
9
+ pinned: false
10
+ license: mit
11
+ ---
12
+
13
+ # 🎤 AI-RVC 语音转换 & AI 翻唱
14
+
15
+ 基于 RVC v2 + RMVPE 的高质量语音转换系统,支持一键 AI 翻唱功能。
16
+
17
+ ## 功能特点
18
+
19
+ - **AI 歌曲翻唱**:上传歌曲自动分离人声、转换音色、混合伴奏,一键生成翻唱
20
+ - **人声分离**:默认 Mel-Band Roformer (KimberleyJensen),在 MVSEP 公开 Multisong 指标中为 Vocals SDR 11.01 / Instrum SDR 17.32
21
+ - **语音转换**:RVC v2 架构 + FAISS 检索增强流程
22
+ - **RMVPE 音高提取**:高精度 F0 提取,噪声鲁棒性强
23
+ - **角色模型**:内置 117 个可下载角色模型
24
+ - **混音效果**:支持人声混响、音量调节、4 种混音预设
25
+ - **卡拉OK模式**:分离主唱和伴唱轨道
26
+ - **VC预处理**:4 种模式(自动、直通、学习型DeEcho、旧版手工链)
27
+ - **双VC管道**:支持当前实现和官方实现
28
+
29
+ ## 使用方法
30
+
31
+ ### 1. 下载角色模型
32
+
33
+ 首次使用需要下载角色模型:
34
+ 1. 进入「歌曲翻唱」标签页
35
+ 2. 展开「下载角色模型」折叠面板
36
+ 3. 选择并下载一个角色(推荐:星空凛、芙宁娜、纳西妲等)
37
+
38
+ ### 2. 开始翻唱
39
+
40
+ 1. 上传歌曲文件(支持 MP3/WAV/FLAC)
41
+ 2. 选择已下载的角色
42
+ 3. 调整参数:
43
+ - 音调偏移:男转女 +12,女转男 -12
44
+ - 混音预设:通用/人声突出/伴奏突出/现场感
45
+ - 卡拉OK模式:启用主唱/伴唱分离
46
+ 4. 点击「🚀 开始翻唱」
47
+ 5. 下载生成的翻唱作品
48
+
49
+ ## 参数说明
50
+
51
+ ### 基础参数
52
+
53
+ - **音调偏移**:半音数,正数升调,负数降调(男转女: +12, 女转男: -12)
54
+ - **索引率**:越高越像训练音色(建议 10-50%)
55
+ - **说话人ID**:多说话人模型的说话人选择(通常为 0)
56
+
57
+ ### 混音预设
58
+
59
+ - **通用**:默认均衡设置
60
+ - **人声突出**:人声 +15%,伴奏 -10%,混响 -5%
61
+ - **伴奏突出**:人声 -10%,伴奏 +15%,混响 -5%
62
+ - **现场感**:默认音量,混响 +10%
63
+
64
+ ### VC 预处理模式
65
+
66
+ - **自动**:根据模型可用性自动选择(推荐)
67
+ - **直通**:主唱直接进入 RVC
68
+ - **学习型 DeEcho**:使用 UVR DeEcho/DeReverb
69
+ - **旧版手工链**:仅用于对比测试
70
+
71
+ ## 可用角色模型(117 个)
72
+
73
+ | 系列 | 角色示例 |
74
+ |------|----------|
75
+ | Love Live! | 星空凛、园田海未、东条希、小泉花阳、南小鸟 |
76
+ | Love Live! Sunshine!! | 高海千歌、樱内梨子、黑泽黛雅、黑泽露比、国木田花丸 |
77
+ | Love Live! 虹咲学园 | 上原步梦、中须霞、天王寺璃奈、近江彼方、优木雪菜 |
78
+ | 原神 | 芙宁娜、枫原万叶、纳西妲、八重神子、雷电将军 |
79
+ | Hololive | Fuwawa、Mococo |
80
+ | 偶像大师 | 神崎兰子、梦见莉亚梦、双叶杏、本田未央、岛村卯月 |
81
+
82
+ > 完整列表请在 UI 中查看「下载角色模型」面板
83
+
84
+ ## 技术架构
85
+
86
+ ```
87
+ 音频输入 → CoverPipeline
88
+
89
+ 人声分离 (Mel-Band Roformer)
90
+
91
+ RVC 语音转换 (HuBERT + RMVPE + FAISS)
92
+
93
+ 混音 (音量调节 + 混响)
94
+
95
+ AI 翻唱成品
96
+ ```
97
+
98
+ ## 常见问题
99
+
100
+ **Q: 首次运行很慢?**
101
+
102
+ A: 首次运行会自动下载模型文件(HuBERT、RMVPE、Roformer 等),请耐心等待。
103
+
104
+ **Q: 高音断音/撕裂?**
105
+
106
+ A: 尝试降低保护系数(0.33 → 0.2),增大滤波半径(3 → 5)。
107
+
108
+ **Q: 转换后声音失真?**
109
+
110
+ A: 降低索引率,调整音调偏移,使用更高质量的输入音频。
111
+
112
+ **Q: 如何选择合适的角色?**
113
+
114
+ A: 建议选择与原唱性别、音色相近的角色,效果更自然。
115
+
116
+ ## 性能说明
117
+
118
+ - **GPU 加速**:自动检测并使用 GPU(CUDA/ROCm)
119
+ - **处理时间**:一首 3-5 分钟的歌曲约需 2-5 分钟处理
120
+ - **显存需求**:建议 4GB 以上显存
121
+
122
+ ## 限制说明
123
+
124
+ - **音频长度**:建议单次处理不超过 10 分钟
125
+ - **文件大小**:建议上传文件不超过 50MB
126
+ - **并发处理**:同时只能处理一个任务
127
+
128
+ ## 更多信息
129
+
130
+ - **GitHub 仓库**:https://github.com/mason369/AI-RVC
131
+ - **完整文档**:查看仓库中的 README.md
132
+ - **Colab 版本**:AI_RVC_Colab.ipynb
133
+ - **问题反馈**:GitHub Issues
134
+
135
+ ## 免责声明
136
+
137
+ 本项目仅供学习研究和个人娱乐用途,不得用于任何商业目的。严禁使用本软件进行欺诈、传播虚假信息或侵犯他人权益。用户对使用本软件产生的所有内容和后果承担全部责任。
138
+
139
+ ## 致谢
140
+
141
+ - [RVC-Project](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) - 原始 RVC 项目
142
+ - [Mel-Band RoFormer](https://arxiv.org/abs/2310.01809) - 人声分离模型
143
+ - [audio-separator](https://github.com/nomadkaraoke/python-audio-separator) - 音源分离框架
144
+ - [RMVPE](https://arxiv.org/abs/2306.15412) - F0 提取
145
+ - [Gradio](https://gradio.app/) - Web 界面框架
146
+
147
+ ---
148
+
149
+ **License**: MIT
150
+ **Version**: 2.0
151
+ **Last Updated**: 2026-03-10