Update README.md
Browse files
README.md
CHANGED
|
@@ -1,3 +1,76 @@
|
|
| 1 |
-
---
|
| 2 |
-
license: gpl-3.0
|
| 3 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
license: gpl-3.0
|
| 3 |
+
datasets:
|
| 4 |
+
- mozi1924/mozi-v2
|
| 5 |
+
tags:
|
| 6 |
+
- rvc
|
| 7 |
+
- rvc-v2
|
| 8 |
+
- zh
|
| 9 |
+
- en
|
| 10 |
+
---
|
| 11 |
+
|
| 12 |
+
# 📼 Mozi V2 (15yo Legacy Ver.) - RVC Model
|
| 13 |
+
|
| 14 |
+

|
| 15 |
+

|
| 16 |
+

|
| 17 |
+
|
| 18 |
+
## 🌟 简介 / Introduction
|
| 19 |
+
|
| 20 |
+
**Mozi V2** 是作者 (Mozi) 在 **15岁** 时训练的 RVC 声音模型。
|
| 21 |
+
这是一个物理层面上已经**绝版**的声音。由于作者已经经历了变声期(生理结构改变),目前的本人(以及后续的 Mozi-3/4 模型)已无法复刻此版本特有的少年音色和高频爆发力。
|
| 22 |
+
|
| 23 |
+
**Mozi V2** is an RVC voice model trained by the author (Mozi) at the **age of 15**.
|
| 24 |
+
This is a biologically **discontinued** voice. Since the author has gone through voice change, this specific juvenile timbre and high-frequency explosive power cannot be reproduced by the current author (nor the later Mozi-3/4 models).
|
| 25 |
+
|
| 26 |
+
## 🎵 声音特征 / Voice Characteristics
|
| 27 |
+
|
| 28 |
+
这个模型以其在翻唱 The Marías 的《Hush》中的表现而存盘(Archive)。
|
| 29 |
+
|
| 30 |
+
* **少年感 (Juvenile Tone)**: 拥有变声期前后的中性与清脆,带有独特的颗粒感。
|
| 31 |
+
* **情绪爆发 (High Emotional Range)**: 训练数据包含恐怖游戏游玩时的真实尖叫(Screaming),因此该模型在处理高音嘶吼、破音或极端情绪时有**奇效**(生草意味)。
|
| 32 |
+
* **复古/Lo-Fi**: 带有早期训练环境的独特质感。
|
| 33 |
+
|
| 34 |
+
> "Hush, don't speak..." ➡️ *(Screams in horror)* ➡️ "...when you spit your venom."
|
| 35 |
+
> —— *The legendary "Hush" cover workflow.*
|
| 36 |
+
|
| 37 |
+
## 📥 模型文件 / Model Files
|
| 38 |
+
|
| 39 |
+
此仓库包含以下文件,请下载后放入 RVC 的 `weights` 和 `logs` 目录使用:
|
| 40 |
+
|
| 41 |
+
* `mozi_v2.pth`: 主模型权重文件。
|
| 42 |
+
* `added_*.index`: 特征检索文件(推荐使用,以还原当年的独特听感)。
|
| 43 |
+
|
| 44 |
+
## 🛠️ 使用说明 / Usage
|
| 45 |
+
|
| 46 |
+
本模型基于 **RVC (Retrieval-based Voice Conversion)** 架构。
|
| 47 |
+
|
| 48 |
+
1. **推荐配置**:
|
| 49 |
+
* Pitch Extraction (f0预测算法): 推荐使用 `rmvpe` 以获得最佳稳定性,或者 `harvest` 以获得更浓厚的色彩。
|
| 50 |
+
* Search Feature Ratio (检索比例): 建议 `0.5` - `0.7`。如果是为了复刻尖叫效果,可以适当调高。
|
| 51 |
+
2. **适用场景**:
|
| 52 |
+
* 翻唱 (Cover Songs): 适合慵懒迷幻风格,或者需要情绪反差的歌曲。
|
| 53 |
+
* 鬼畜/Meme: 利用其尖叫特性制作趣味视频。
|
| 54 |
+
|
| 55 |
+
## 🧬 数据集 / Dataset
|
| 56 |
+
|
| 57 |
+
本模型的原始训练数据已开源,遵循 GPL-3.0 协议:
|
| 58 |
+
👉 **[HuggingFace: mozi1924/mozi-v2](https://huggingface.co/datasets/mozi1924/mozi-v2)**
|
| 59 |
+
|
| 60 |
+
如果你想研究如何炼出这种音色,或者想尝试用更先进的算法(如 RVC v3, Sovits 等)重新训练,欢迎下载数据集。
|
| 61 |
+
|
| 62 |
+
## 📜 协议 / License
|
| 63 |
+
|
| 64 |
+
本项目遵循 **GNU General Public License v3.0 (GPL-3.0)**。
|
| 65 |
+
|
| 66 |
+
* ✅ 自由使用、修改、分享。
|
| 67 |
+
* ✅ 可用于二创视频(请标注模型来源)。
|
| 68 |
+
* 🔄 **Copyleft**: 任何基于此模型的修改版或派生模型,必须以相同的 GPL 3.0 协议开源。
|
| 69 |
+
|
| 70 |
+
## 🔗 链接 / Links
|
| 71 |
+
|
| 72 |
+
* **Author's Website**: [mozi1924.com](https://mozi1924.com)
|
| 73 |
+
* **Original Demo**: (这里可以放你B站或者视频平台的链接,如果有的话)
|
| 74 |
+
|
| 75 |
+
---
|
| 76 |
+
*Time flies, but the voice remains. Enjoy the scream.*
|