phate334 commited on
Commit
a6ad5f6
·
verified ·
1 Parent(s): cd241b7

Upload README.md

Browse files
Files changed (1) hide show
  1. README.md +52 -8
README.md CHANGED
@@ -15,22 +15,66 @@ tags:
15
  - taiwanese-hokkien
16
  - taigi
17
  - low-resource-language
 
18
  - ctranslate2
 
19
  - quantized
20
  - float16
21
  ---
22
 
23
  # Breeze-ASR-26-float16-CT2
24
 
25
- This model is a quantized `ctranslate2` version of `MediaTek-Research/Breeze-ASR-26`. No additional training is documented for this artifact.
26
 
27
- ## Source Model
28
 
29
- - Model: [MediaTek-Research/Breeze-ASR-26](https://huggingface.co/MediaTek-Research/Breeze-ASR-26)
30
- - Revision: `7b992682e7f5ceedd0a41ebec240f01ba469d19e`
31
- - License: Apache-2.0, as declared by the source model card
32
 
33
- ## Quantization
34
 
35
- - Backend: `ctranslate2`
36
- - Quantization: `float16`
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
15
  - taiwanese-hokkien
16
  - taigi
17
  - low-resource-language
18
+ - arxiv:2603.19259
19
  - ctranslate2
20
+ - ct2
21
  - quantized
22
  - float16
23
  ---
24
 
25
  # Breeze-ASR-26-float16-CT2
26
 
27
+ 這是由 `MediaTek-Research/Breeze-ASR-26` 轉換而來的 `ctranslate2` 量化版本;此 artifact 沒有額外訓練紀錄。
28
 
29
+ ## 來源模型
30
 
31
+ - 模型:[MediaTek-Research/Breeze-ASR-26](https://huggingface.co/MediaTek-Research/Breeze-ASR-26)
32
+ - Revision`7b992682e7f5ceedd0a41ebec240f01ba469d19e`
33
+ - 授權:Apache-2.0,依來源模型卡宣告
34
 
35
+ ## 量化資訊
36
 
37
+ - Backend`ctranslate2`
38
+ - 量化:`float16`
39
+
40
+ ## 評估摘要
41
+
42
+ 這次評估使用教育部臺灣台語常用詞辭典例句音檔:
43
+ [教育部臺灣台語常用詞辭典相關資源](https://sutian.moe.edu.tw/und-hani/siongkuantsuguan/).
44
+ 評估子集取例句音檔中 `hanzi` 長度最長的 100 筆樣本。
45
+
46
+ 以下 CER 使用原始 HF `float16` 推論結果作為 pseudo-reference,衡量不同轉換/量化版本相對於原始模型輸出的 drift。
47
+ 這不是對人工標註逐字稿計算的 ASR CER。計算時會先移除輸出文字中的所有空白,再計算字元級 Levenshtein distance。
48
+
49
+ 以這次結果來看,量化部署建議優先使用 `CT2 int8`:
50
+ 它完成全部 100 筆樣本,VRAM 約 `2097-2129 MiB`,相對 HF `float16` baseline 的 CER drift 為 `0.1263`,整體成本效益最好。
51
+
52
+ | 版本 | 推論結果 | 成功/總數 | VRAM MiB |
53
+ |---|---|---:|---:|
54
+ | [vLLM HF `float16`](https://huggingface.co/MediaTek-Research/Breeze-ASR-26) | `vllm-hf-float16.jsonl` | 100/100 | 21267-21267 |
55
+ | [CT2 `float16`](https://huggingface.co/phate334/Breeze-ASR-26-float16-CT2) | `ct2-float16.jsonl` | 100/100 | 3991-3991 |
56
+ | [CT2 `int8_float16`](https://huggingface.co/phate334/Breeze-ASR-26-int8_float16-CT2) | `ct2-int8_float16.jsonl` | 100/100 | 2103-2135 |
57
+ | [CT2 `int8`](https://huggingface.co/phate334/Breeze-ASR-26-int8-CT2) | `ct2-int8.jsonl` | 100/100 | 2097-2129 |
58
+ | [whisper.cpp / GGML `q4_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q4_0.jsonl` | 100/100 | 1843-1843 |
59
+ | [whisper.cpp / GGML `q4_1`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q4_1.jsonl` | 100/100 | 1935-1935 |
60
+ | [whisper.cpp / GGML `q5_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q5_0.jsonl` | 100/100 | 2027-2027 |
61
+ | [whisper.cpp / GGML `q8_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q8_0.jsonl` | 100/100 | 2575-2575 |
62
+
63
+ ### 相對 HF Baseline 的 CER
64
+
65
+ Baseline reference:`vllm-hf-float16.jsonl`。
66
+
67
+ | 比較版本 | CER | 字元錯誤/參考字元 | 完全一致 |
68
+ |---|---:|---:|---:|
69
+ | `ct2-int8_float16.jsonl` | 0.1157 | 633/5470 | 11 |
70
+ | `ct2-float16.jsonl` | 0.1176 | 643/5470 | 7 |
71
+ | `ct2-int8.jsonl` | 0.1263 | 691/5470 | 5 |
72
+ | `whisper-cpp-ggml-q5_0.jsonl` | 0.1803 | 986/5470 | 5 |
73
+ | `whisper-cpp-ggml-q8_0.jsonl` | 0.1879 | 1028/5470 | 6 |
74
+ | `whisper-cpp-ggml-q4_0.jsonl` | 0.1927 | 1054/5470 | 2 |
75
+ | `whisper-cpp-ggml-q4_1.jsonl` | 0.2558 | 1399/5470 | 2 |
76
+
77
+ ## 更多資訊
78
+
79
+ 評估程式、資料準備方式與完整結果報表請見 GitHub repository:
80
+ https://github.com/phate334/stt-eval