Update README.md
Browse files
README.md
CHANGED
|
@@ -23,6 +23,11 @@ base_model:
|
|
| 23 |
|
| 24 |
【声明】: 本人明确知道这属于是典型的“烂活旧整”范畴
|
| 25 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 26 |
## 2. 关于数据集与训练初衷 (Dataset & Motivation)
|
| 27 |
- **数据规模 (Duration):** 约 95 分钟(1.6 小时)有效语音数据。
|
| 28 |
- **数据来源 (Source):** 采集自 Bilibili 峰哥直播切片(非正式录播视频,故原始素材带有典型的直播录像音质特征,并未进行专门的降噪)。
|
|
|
|
| 23 |
|
| 24 |
【声明】: 本人明确知道这属于是典型的“烂活旧整”范畴
|
| 25 |
|
| 26 |
+
效果预览 (Audio Preview):可以试听仓库中附带的演示音频文件:`峰哥聊发展中国家.wav`。
|
| 27 |
+
|
| 28 |
+
- **效果点评:** 整体的口音细节与音色还原度非常不错,能够抓到峰哥说话的精髓。
|
| 29 |
+
- **优化建议:** 演示音频中存在经典的“电音”或机械感。在本地实际部署后,完全可以通过微调下方推荐的“推理超参数” 来进一步优化,获得更自然的效果。
|
| 30 |
+
|
| 31 |
## 2. 关于数据集与训练初衷 (Dataset & Motivation)
|
| 32 |
- **数据规模 (Duration):** 约 95 分钟(1.6 小时)有效语音数据。
|
| 33 |
- **数据来源 (Source):** 采集自 Bilibili 峰哥直播切片(非正式录播视频,故原始素材带有典型的直播录像音质特征,并未进行专门的降噪)。
|