Tele-AI
/

TeleSpeech-ASR1.0

Model card Files Files and versions

TTTdas commited on May 31, 2024

Commit

31e0429

·

verified ·

1 Parent(s): 643e4fc

Update README.md

Files changed (1) hide show

README.md +6 -13

README.md CHANGED Viewed

@@ -9,7 +9,7 @@ license: apache-2.0
 </div>
 <p align="center">
-🦉 <a href="https://github.com/Tele-AI/TeleSpeech-ASR" target="_blank">github</a>️ • 🐾 <a href="https://gitee.com/Tele-AI/TeleSpeech-ASR" target="_blank">gitee</a>️
 </p>
 星辰超多方言语音识别大模型v1.0，由30万小时无标注多方言语音数据进行预训练，并利用内部30种有标注数据进行微调，打破单一模型只能识别特定单一方言的困境，可支持理解粤语、上海话、四川话、温州话等30种方言
@@ -28,14 +28,12 @@ license: apache-2.0
 # 环境配置
-环境依赖
 * PyTorch version >= 1.13.0
 * Python version >= 3.8
 * 数据准备、程序训练需要使用kaldi，请确保已正确安装：https://github.com/kaldi-asr/kaldi
   * 若已有提好的特征，程序运行时可以使用wenet开源框架中kaldi_io.py实现的方法替换kaldiio.load_mat，从而无需安装kaldi
-## 微调
 <a id="fairseq安装"></a>
 * 安装fairseq及其依赖
 ```shell script
@@ -44,19 +42,14 @@ $ cd fairseq
 $ pip install --editable ./
 ```
-* 安装kaldiio
 ```shell script
-$ pip install kaldiio
 ```
-## 表征训练下游任务
-* 确保fairseq已正确[安装](#fairseq安装)
-* 安装表征训练任务运行所需依赖
 ```shell script
-$ cd wenet_representation
-$ pip install -r requirements.txt
 ```
 # 数据准备

 </div>
 <p align="center">
+🦉 <a href="https://github.com/Tele-AI/TeleSpeech-ASR" target="_blank">github</a>️ • 🐾 <a href="https://gitee.com/Tele-AI/TeleSpeech-ASR" target="_blank">gitee</a>️ • 🤖 <a href="https://www.modelscope.cn/models/TeleAI/TeleSpeech-ASR1.0/summary" target="_blank">ModelScope</a>
 </p>
 星辰超多方言语音识别大模型v1.0，由30万小时无标注多方言语音数据进行预训练，并利用内部30种有标注数据进行微调，打破单一模型只能识别特定单一方言的困境，可支持理解粤语、上海话、四川话、温州话等30种方言
 # 环境配置
 * PyTorch version >= 1.13.0
 * Python version >= 3.8
 * 数据准备、程序训练需要使用kaldi，请确保已正确安装：https://github.com/kaldi-asr/kaldi
   * 若已有提好的特征，程序运行时可以使用wenet开源框架中kaldi_io.py实现的方法替换kaldiio.load_mat，从而无需安装kaldi
 <a id="fairseq安装"></a>
 * 安装fairseq及其依赖
 ```shell script
 $ pip install --editable ./
 ```
+* 安装fairseq额外依赖以及wenet表征训练任务运行所需依赖
 ```shell script
+$ pip install -r requirements.txt
 ```
+* 若只需要fairseq进行微调、解码，可以不安装完整的requirements.txt，只需保证kaldiio, timm, editdistance, soundfile已正确安装
 ```shell script
+$ pip install kaldiio timm editdistance soundfile
 ```
 # 数据准备