Scribby CoreML Encoders

逐字搞定(Scribby) 預先編譯的 whisper.cpp CoreML encoder 模型,讓 macOS 裝置可以透過 Apple Neural Engine (ANE) 加速語音辨識。

檔案說明

檔案 對應模型 大小 說明
ggml-large-v3-encoder.mlmodelc.zip whisper large-v3 ~1.1 GB 最高精度
ggml-large-v3-turbo-encoder.mlmodelc.zip whisper large-v3-turbo ~1.1 GB 快速、高精度

使用方式

這些檔案由 Scribby app 在首次啟動時自動下載,無需手動操作。

如需手動使用:

# 下載
wget https://huggingface.co/souminei/scribby-coreml-encoders/resolve/main/ggml-large-v3-encoder.mlmodelc.zip

# 解壓到 whisper.cpp models 目錄
unzip ggml-large-v3-encoder.mlmodelc.zip -d /path/to/whisper.cpp/models/

產生方式

  1. 使用 openai-whisper Python 模型轉換為 CoreML .mlpackage
  2. 使用 coremltools.utils.compile_model() 編譯為 .mlmodelc

轉換時使用 128 mel bins(n_mels=128)和輸入形狀 (1, 128, 3000),對應 whisper large-v3 系列的規格。

相容性

  • macOS 13+ (Ventura 或更新)
  • Apple Silicon (M1/M2/M3/M4)
  • 搭配 whisper.cpp 使用(需開啟 WHISPER_USE_COREML

授權

MIT License

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support