Update README.md
Browse files
README.md
CHANGED
|
@@ -17,10 +17,13 @@ license: apache-2.0
|
|
| 17 |
|
| 18 |
本次发布版本和下载链接见下表
|
| 19 |
|
| 20 |
-
| 模型版本 | 参数量 | 下载链接 |
|
| 21 |
-
|---------------------|-------|---------------------|
|
| 22 |
-
| pretrain_base | 0.09 B | [TeleSpeech-ASR1.0-base](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/base.pt) |
|
| 23 |
-
| pretrain_large | 0.3 B | [TeleSpeech-ASR1.0-large](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/large.pt) |
|
|
|
|
|
|
|
|
|
|
| 24 |
|
| 25 |
|
| 26 |
# 环境配置
|
|
@@ -143,6 +146,11 @@ utt:X0000000001_100849618_S00006 feat:/data/raw_nnaudio.test.1.ark:2984296665 fe
|
|
| 143 |
|
| 144 |
*WenetSpeech中的结果为分别使用 `train_s/train_m`训练后,在Test_Meeting上的CER
|
| 145 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 146 |
# 声明与协议
|
| 147 |
## 声明
|
| 148 |
我们在此声明,不要使用TeleSpeech模型及其衍生模型进行任何危害国家社会安全或违法的活动。同时,我们也要求使用者不要将TeleSpeech模型用于没有安全审查和备案的互联网服务。我们希望所有使用者遵守上述原则,确保科技发展在合法合规的环境下进行。
|
|
|
|
| 17 |
|
| 18 |
本次发布版本和下载链接见下表
|
| 19 |
|
| 20 |
+
| 模型版本 | 参数量 | 下载链接 | 字典 |
|
| 21 |
+
|---------------------|-------|---------------------|-------|
|
| 22 |
+
| pretrain_base | 0.09 B | [TeleSpeech-ASR1.0-base](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/base.pt) | ✗ |
|
| 23 |
+
| pretrain_large | 0.3 B | [TeleSpeech-ASR1.0-large](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/large.pt) | ✗ |
|
| 24 |
+
| finetune_large_kespeech | 0.3 B | [TeleSpeech-ASR1.0-large-kespeech](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/finetune_large_kespeech.pt) | [dict.char7531.txt](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/dict.chr7531.txt) |
|
| 25 |
+
|
| 26 |
+
finetune模型为已经微调过的模型,可直接使用;pretrain模型为无监督预训练模型,我们提供了两种有监督训练框架,用于下游ASR任务:基于fairseq的微调、基于wenet的表征提取训练ASR模型(特征提取器)
|
| 27 |
|
| 28 |
|
| 29 |
# 环境配置
|
|
|
|
| 146 |
|
| 147 |
*WenetSpeech中的结果为分别使用 `train_s/train_m`训练后,在Test_Meeting上的CER
|
| 148 |
|
| 149 |
+
KeSpeech各方言上结果
|
| 150 |
+
| 模型版本 | 普通话 | 北京 | 西南 | 中原 | 东北 | 兰银 | 江淮 | 冀鲁 | 胶辽 |
|
| 151 |
+
| ---------| ------ | ---- | ---- | ---- |---- | ---- | ---- | ---- | ---- |
|
| 152 |
+
| pretrain_large | 4.61 | 8.23 | 8.74 | 7.62 | 7.89 | 9.72 | 12.89 | 8.91 | 9.30 |
|
| 153 |
+
|
| 154 |
# 声明与协议
|
| 155 |
## 声明
|
| 156 |
我们在此声明,不要使用TeleSpeech模型及其衍生模型进行任何危害国家社会安全或违法的活动。同时,我们也要求使用者不要将TeleSpeech模型用于没有安全审查和备案的互联网服务。我们希望所有使用者遵守上述原则,确保科技发展在合法合规的环境下进行。
|