Breeze-ASR-26 Quantized Models
Collection
CT2 and GGML quantized artifacts derived from MediaTek-Research/Breeze-ASR-26. • 4 items • Updated
本模型由 MediaTek-Research/Breeze-ASR-26 轉換為 ctranslate2 量化格式,未額外微調。
ctranslate2int8資料來源:教育部臺灣台語常用詞辭典例句音檔,取 hanzi 長度最長的 100 筆樣本。
CER 以原始 HF float16 推論結果作為偽參考,用來衡量轉換/量化後的輸出偏移;這不是人工標註逐字稿 CER。計算前會先移除所有空白,再計算字元級 Levenshtein 距離。
量化部署建議優先使用 CT2 int8:100 筆全數成功,VRAM 約 2097-2129 MiB,相對 HF float16 基準的 CER 為 0.1263。
| 版本 | 結果檔 | 成功/總數 | VRAM MiB |
|---|---|---|---|
vLLM HF float16 |
vllm-hf-float16.jsonl |
100/100 | 21267-21267 |
CT2 float16 |
ct2-float16.jsonl |
100/100 | 3991-3991 |
CT2 int8_float16 |
ct2-int8_float16.jsonl |
100/100 | 2103-2135 |
CT2 int8 |
ct2-int8.jsonl |
100/100 | 2097-2129 |
whisper.cpp / GGML q4_0 |
whisper-cpp-ggml-q4_0.jsonl |
100/100 | 1843-1843 |
whisper.cpp / GGML q4_1 |
whisper-cpp-ggml-q4_1.jsonl |
100/100 | 1935-1935 |
whisper.cpp / GGML q5_0 |
whisper-cpp-ggml-q5_0.jsonl |
100/100 | 2027-2027 |
whisper.cpp / GGML q8_0 |
whisper-cpp-ggml-q8_0.jsonl |
100/100 | 2575-2575 |
基準:vllm-hf-float16.jsonl。
| 比較版本 | CER | 字元錯誤 / 參考字元 | 完全一致 |
|---|---|---|---|
ct2-int8_float16.jsonl |
0.1157 | 633/5470 | 11 |
ct2-float16.jsonl |
0.1176 | 643/5470 | 7 |
ct2-int8.jsonl |
0.1263 | 691/5470 | 5 |
whisper-cpp-ggml-q5_0.jsonl |
0.1803 | 986/5470 | 5 |
whisper-cpp-ggml-q8_0.jsonl |
0.1879 | 1028/5470 | 6 |
whisper-cpp-ggml-q4_0.jsonl |
0.1927 | 1054/5470 | 2 |
whisper-cpp-ggml-q4_1.jsonl |
0.2558 | 1399/5470 | 2 |
評估程式、資料準備與完整報表: https://github.com/phate334/stt-eval
Base model
openai/whisper-large-v2