| --- |
| base_model: MediaTek-Research/Breeze-ASR-26 |
| base_model_relation: quantized |
| language: |
| - nan |
| - zh |
| library_name: ctranslate2 |
| license: apache-2.0 |
| metrics: |
| - cer |
| pipeline_tag: automatic-speech-recognition |
| tags: |
| - automatic-speech-recognition |
| - whisper |
| - taiwanese-hokkien |
| - taigi |
| - low-resource-language |
| - arxiv:2603.19259 |
| - ctranslate2 |
| - ct2 |
| - quantized |
| - float16 |
| --- |
| |
| # Breeze-ASR-26-float16-CT2 |
|
|
| 本模型由 [MediaTek-Research/Breeze-ASR-26](https://huggingface.co/MediaTek-Research/Breeze-ASR-26) 轉換為 `ctranslate2` 量化格式,未額外微調。 |
|
|
| ## 量化 |
|
|
| - 後端:`ctranslate2` |
| - 量化:`float16` |
|
|
| ## 評估 |
|
|
| 資料來源:教育部臺灣台語常用詞辭典例句音檔,取 `hanzi` 長度最長的 100 筆樣本。 |
|
|
| - [教育部臺灣台語常用詞辭典相關資源](https://sutian.moe.edu.tw/und-hani/siongkuantsuguan/) |
|
|
| CER 以原始 HF `float16` 推論結果作為偽參考,用來衡量轉換/量化後的輸出偏移;這不是人工標註逐字稿 CER。計算前會先移除所有空白,再計算字元級 Levenshtein 距離。 |
|
|
| 量化部署建議優先使用 `CT2 int8`:100 筆全數成功,VRAM 約 `2097-2129 MiB`,相對 HF `float16` 基準的 CER 為 `0.1263`。 |
|
|
| | 版本 | 結果檔 | 成功/總數 | VRAM MiB | |
| |---|---|---:|---:| |
| | [vLLM HF `float16`](https://huggingface.co/MediaTek-Research/Breeze-ASR-26) | `vllm-hf-float16.jsonl` | 100/100 | 21267-21267 | |
| | [CT2 `float16`](https://huggingface.co/phate334/Breeze-ASR-26-float16-CT2) | `ct2-float16.jsonl` | 100/100 | 3991-3991 | |
| | [CT2 `int8_float16`](https://huggingface.co/phate334/Breeze-ASR-26-int8_float16-CT2) | `ct2-int8_float16.jsonl` | 100/100 | 2103-2135 | |
| | [CT2 `int8`](https://huggingface.co/phate334/Breeze-ASR-26-int8-CT2) | `ct2-int8.jsonl` | 100/100 | 2097-2129 | |
| | [whisper.cpp / GGML `q4_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q4_0.jsonl` | 100/100 | 1843-1843 | |
| | [whisper.cpp / GGML `q4_1`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q4_1.jsonl` | 100/100 | 1935-1935 | |
| | [whisper.cpp / GGML `q5_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q5_0.jsonl` | 100/100 | 2027-2027 | |
| | [whisper.cpp / GGML `q8_0`](https://huggingface.co/phate334/Breeze-ASR-26-GGML) | `whisper-cpp-ggml-q8_0.jsonl` | 100/100 | 2575-2575 | |
|
|
| ### 相對 HF 基準的 CER |
|
|
| 基準:`vllm-hf-float16.jsonl`。 |
|
|
| | 比較版本 | CER | 字元錯誤 / 參考字元 | 完全一致 | |
| |---|---:|---:|---:| |
| | `ct2-int8_float16.jsonl` | 0.1157 | 633/5470 | 11 | |
| | `ct2-float16.jsonl` | 0.1176 | 643/5470 | 7 | |
| | `ct2-int8.jsonl` | 0.1263 | 691/5470 | 5 | |
| | `whisper-cpp-ggml-q5_0.jsonl` | 0.1803 | 986/5470 | 5 | |
| | `whisper-cpp-ggml-q8_0.jsonl` | 0.1879 | 1028/5470 | 6 | |
| | `whisper-cpp-ggml-q4_0.jsonl` | 0.1927 | 1054/5470 | 2 | |
| | `whisper-cpp-ggml-q4_1.jsonl` | 0.2558 | 1399/5470 | 2 | |
|
|
| ## 更多資訊 |
|
|
| 評估程式、資料準備與完整報表: |
| https://github.com/phate334/stt-eval |
|
|