Scribby CoreML Encoders
為 逐字搞定(Scribby) 預先編譯的 whisper.cpp CoreML encoder 模型,讓 macOS 裝置可以透過 Apple Neural Engine (ANE) 加速語音辨識。
檔案說明
| 檔案 | 對應模型 | 大小 | 說明 |
|---|---|---|---|
ggml-large-v3-encoder.mlmodelc.zip |
whisper large-v3 | ~1.1 GB | 最高精度 |
ggml-large-v3-turbo-encoder.mlmodelc.zip |
whisper large-v3-turbo | ~1.1 GB | 快速、高精度 |
使用方式
這些檔案由 Scribby app 在首次啟動時自動下載,無需手動操作。
如需手動使用:
# 下載
wget https://huggingface.co/souminei/scribby-coreml-encoders/resolve/main/ggml-large-v3-encoder.mlmodelc.zip
# 解壓到 whisper.cpp models 目錄
unzip ggml-large-v3-encoder.mlmodelc.zip -d /path/to/whisper.cpp/models/
產生方式
- 使用
openai-whisperPython 模型轉換為 CoreML.mlpackage - 使用
coremltools.utils.compile_model()編譯為.mlmodelc
轉換時使用 128 mel bins(n_mels=128)和輸入形狀 (1, 128, 3000),對應 whisper large-v3 系列的規格。
相容性
- macOS 13+ (Ventura 或更新)
- Apple Silicon (M1/M2/M3/M4)
- 搭配 whisper.cpp 使用(需開啟
WHISPER_USE_COREML)
授權
MIT License
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support