Upload README_HF.md with huggingface_hub
Browse files- README_HF.md +151 -0
README_HF.md
ADDED
|
@@ -0,0 +1,151 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
title: AI-RVC 语音转换 & AI 翻唱
|
| 3 |
+
emoji: 🎤
|
| 4 |
+
colorFrom: blue
|
| 5 |
+
colorTo: purple
|
| 6 |
+
sdk: gradio
|
| 7 |
+
sdk_version: 3.50.2
|
| 8 |
+
app_file: app.py
|
| 9 |
+
pinned: false
|
| 10 |
+
license: mit
|
| 11 |
+
---
|
| 12 |
+
|
| 13 |
+
# 🎤 AI-RVC 语音转换 & AI 翻唱
|
| 14 |
+
|
| 15 |
+
基于 RVC v2 + RMVPE 的高质量语音转换系统,支持一键 AI 翻唱功能。
|
| 16 |
+
|
| 17 |
+
## 功能特点
|
| 18 |
+
|
| 19 |
+
- **AI 歌曲翻唱**:上传歌曲自动分离人声、转换音色、混合伴奏,一键生成翻唱
|
| 20 |
+
- **人声分离**:默认 Mel-Band Roformer (KimberleyJensen),在 MVSEP 公开 Multisong 指标中为 Vocals SDR 11.01 / Instrum SDR 17.32
|
| 21 |
+
- **语音转换**:RVC v2 架构 + FAISS 检索增强流程
|
| 22 |
+
- **RMVPE 音高提取**:高精度 F0 提取,噪声鲁棒性强
|
| 23 |
+
- **角色模型**:内置 117 个可下载角色模型
|
| 24 |
+
- **混音效果**:支持人声混响、音量调节、4 种混音预设
|
| 25 |
+
- **卡拉OK模式**:分离主唱和伴唱轨道
|
| 26 |
+
- **VC预处理**:4 种模式(自动、直通、学习型DeEcho、旧版手工链)
|
| 27 |
+
- **双VC管道**:支持当前实现和官方实现
|
| 28 |
+
|
| 29 |
+
## 使用方法
|
| 30 |
+
|
| 31 |
+
### 1. 下载角色模型
|
| 32 |
+
|
| 33 |
+
首次使用需要下载角色模型:
|
| 34 |
+
1. 进入「歌曲翻唱」标签页
|
| 35 |
+
2. 展开「下载角色模型」折叠面板
|
| 36 |
+
3. 选择并下载一个角色(推荐:星空凛、芙宁娜、纳西妲等)
|
| 37 |
+
|
| 38 |
+
### 2. 开始翻唱
|
| 39 |
+
|
| 40 |
+
1. 上传歌曲文件(支持 MP3/WAV/FLAC)
|
| 41 |
+
2. 选择已下载的角色
|
| 42 |
+
3. 调整参数:
|
| 43 |
+
- 音调偏移:男转女 +12,女转男 -12
|
| 44 |
+
- 混音预设:通用/人声突出/伴奏突出/现场感
|
| 45 |
+
- 卡拉OK模式:启用主唱/伴唱分离
|
| 46 |
+
4. 点击「🚀 开始翻唱」
|
| 47 |
+
5. 下载生成的翻唱作品
|
| 48 |
+
|
| 49 |
+
## 参数说明
|
| 50 |
+
|
| 51 |
+
### 基础参数
|
| 52 |
+
|
| 53 |
+
- **音调偏移**:半音数,正数升调,负数降调(男转女: +12, 女转男: -12)
|
| 54 |
+
- **索引率**:越高越像训练音色(建议 10-50%)
|
| 55 |
+
- **说话人ID**:多说话人模型的说话人选择(通常为 0)
|
| 56 |
+
|
| 57 |
+
### 混音预设
|
| 58 |
+
|
| 59 |
+
- **通用**:默认均衡设置
|
| 60 |
+
- **人声突出**:人声 +15%,伴奏 -10%,混响 -5%
|
| 61 |
+
- **伴奏突出**:人声 -10%,伴奏 +15%,混响 -5%
|
| 62 |
+
- **现场感**:默认音量,混响 +10%
|
| 63 |
+
|
| 64 |
+
### VC 预处理模式
|
| 65 |
+
|
| 66 |
+
- **自动**:根据模型可用性自动选择(推荐)
|
| 67 |
+
- **直通**:主唱直接进入 RVC
|
| 68 |
+
- **学习型 DeEcho**:使用 UVR DeEcho/DeReverb
|
| 69 |
+
- **旧版手工链**:仅用于对比测试
|
| 70 |
+
|
| 71 |
+
## 可用角色模型(117 个)
|
| 72 |
+
|
| 73 |
+
| 系列 | 角色示例 |
|
| 74 |
+
|------|----------|
|
| 75 |
+
| Love Live! | 星空凛、园田海未、东条希、小泉花阳、南小鸟 |
|
| 76 |
+
| Love Live! Sunshine!! | 高海千歌、樱内梨子、黑泽黛雅、黑泽露比、国木田花丸 |
|
| 77 |
+
| Love Live! 虹咲学园 | 上原步梦、中须霞、天王寺璃奈、近江彼方、优木雪菜 |
|
| 78 |
+
| 原神 | 芙宁娜、枫原万叶、纳西妲、八重神子、雷电将军 |
|
| 79 |
+
| Hololive | Fuwawa、Mococo |
|
| 80 |
+
| 偶像大师 | 神崎兰子、梦见莉亚梦、双叶杏、本田未央、岛村卯月 |
|
| 81 |
+
|
| 82 |
+
> 完整列表请在 UI 中查看「下载角色模型」面板
|
| 83 |
+
|
| 84 |
+
## 技术架构
|
| 85 |
+
|
| 86 |
+
```
|
| 87 |
+
音频输入 → CoverPipeline
|
| 88 |
+
↓
|
| 89 |
+
人声分离 (Mel-Band Roformer)
|
| 90 |
+
↓
|
| 91 |
+
RVC 语音转换 (HuBERT + RMVPE + FAISS)
|
| 92 |
+
↓
|
| 93 |
+
混音 (音量调节 + 混响)
|
| 94 |
+
↓
|
| 95 |
+
AI 翻唱成品
|
| 96 |
+
```
|
| 97 |
+
|
| 98 |
+
## 常见问题
|
| 99 |
+
|
| 100 |
+
**Q: 首次运行很慢?**
|
| 101 |
+
|
| 102 |
+
A: 首次运行会自动下载模型文件(HuBERT、RMVPE、Roformer 等),请耐心等待。
|
| 103 |
+
|
| 104 |
+
**Q: 高音断音/撕裂?**
|
| 105 |
+
|
| 106 |
+
A: 尝试降低保护系数(0.33 → 0.2),增大滤波半径(3 → 5)。
|
| 107 |
+
|
| 108 |
+
**Q: 转换后声音失真?**
|
| 109 |
+
|
| 110 |
+
A: 降低索引率,调整音调偏移,使用更高质量的输入音频。
|
| 111 |
+
|
| 112 |
+
**Q: 如何选择合适的角色?**
|
| 113 |
+
|
| 114 |
+
A: 建议选择与原唱性别、音色相近的角色,效果更自然。
|
| 115 |
+
|
| 116 |
+
## 性能说明
|
| 117 |
+
|
| 118 |
+
- **GPU 加速**:自动检测并使用 GPU(CUDA/ROCm)
|
| 119 |
+
- **处理时间**:一首 3-5 分钟的歌曲约需 2-5 分钟处理
|
| 120 |
+
- **显存需求**:建议 4GB 以上显存
|
| 121 |
+
|
| 122 |
+
## 限制说明
|
| 123 |
+
|
| 124 |
+
- **音频长度**:建议单次处理不超过 10 分钟
|
| 125 |
+
- **文件大小**:建议上传文件不超过 50MB
|
| 126 |
+
- **并发处理**:同时只能处理一个任务
|
| 127 |
+
|
| 128 |
+
## 更多信息
|
| 129 |
+
|
| 130 |
+
- **GitHub 仓库**:https://github.com/mason369/AI-RVC
|
| 131 |
+
- **完整文档**:查看仓库中的 README.md
|
| 132 |
+
- **Colab 版本**:AI_RVC_Colab.ipynb
|
| 133 |
+
- **问题反馈**:GitHub Issues
|
| 134 |
+
|
| 135 |
+
## 免责声明
|
| 136 |
+
|
| 137 |
+
本项目仅供学习研究和个人娱乐用途,不得用于任何商业目的。严禁使用本软件进行欺诈、传播虚假信息或侵犯他人权益。用户对使用本软件产生的所有内容和后果承担全部责任。
|
| 138 |
+
|
| 139 |
+
## 致谢
|
| 140 |
+
|
| 141 |
+
- [RVC-Project](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI) - 原始 RVC 项目
|
| 142 |
+
- [Mel-Band RoFormer](https://arxiv.org/abs/2310.01809) - 人声分离模型
|
| 143 |
+
- [audio-separator](https://github.com/nomadkaraoke/python-audio-separator) - 音源分离框架
|
| 144 |
+
- [RMVPE](https://arxiv.org/abs/2306.15412) - F0 提取
|
| 145 |
+
- [Gradio](https://gradio.app/) - Web 界面框架
|
| 146 |
+
|
| 147 |
+
---
|
| 148 |
+
|
| 149 |
+
**License**: MIT
|
| 150 |
+
**Version**: 2.0
|
| 151 |
+
**Last Updated**: 2026-03-10
|