AI-baki / docs /update_info.md
Chars's picture
Upload folder using huggingface_hub
3f9bd99

整合包更新内容(V2.1)

Bert-VITS2更新可参阅:

  • 代码版本:11.30日master分支代码

更新日志

WebUI管理器和整合包更新(2.1)

  • 1.增加对whisper-large-V3支持,打标准确性有些许提升
  • 2.whisper打标默认会同时生成.lab标注文本文件,下一次处理数据集就更简单了。
  • 3.提前一个版本加入情绪快速分类功能(见辅助功能),支持编辑和预览分类配置文件,推理时可以快速调用参考音频。
  • 4.支持启动HiyoriUI推理(截止制作时,对应版本还未发布,有需要可以自己去下载,并自己更新server_fastapi.py)
  • 5.管理器支持启动参数-p指定端口,默认6660。
  • 6.比原来更好的界面(?)

还未更新的内容

推荐的工具/软件

Hiyori UI for BertVits2

jiangyuxiaoxiao/Bert-VITS2-UI

  • 官方的全新推理UI,支持动态加载、卸载模型,更换模型无需重启。
  • 在2.0.2版本旧整合包中已经集成了Hiyori UI,但截止本整合包发布时,还没有推出适配的版本。有需要可以自己去下载,并自己更新server_fastapi.py。

SubFix

cronrpc/SubFix
[B站链接]https://www.bilibili.com/video/BV1My4y1P7WX/

SubFix是一个数据集辅助制作工具,一个用于轻松地编辑修改音频字幕的网页工具。能够实时地看到改动,方便地对音频进行合并、分割、删除、编辑字幕,同时能够马上知道改动后的效果。

Audio-Slicer(slicer-gui)

音频切分工具,建议在whisper打标前使用。音频过长或长度变化大会导致显存开过山车影响训练效率。

UVR5

分离背景音乐/噪声和人声的AI软件。不多赘述。