SenseVoiceSmall ONNX(FP16)

本仓库为 SenseVoiceSmallFP16 ONNX 导出版本,由 ModelScope iic/SenseVoiceSmallFunASR 导出(float16),便于在 ONNX Runtime 等环境中直接使用,体积约 450MB。

模型说明

  • 来源:阿里巴巴达摩院 SenseVoice,Small 版本
  • 格式:ONNX(float16),含外部权重文件 model.onnx.data
  • 用途:语音识别(ASR)、多语种识别(中文/粤语/英/日/韩等)
  • 输入:16 kHz 单声道音频(如 wav)
  • 输出:转写文本

文件说明

文件 说明
model.onnx ONNX 计算图(FP16)
model.onnx.data 权重(约 468MB)
tokens.json 词表
am.mvn 特征归一化参数
config.yaml 模型与前端配置

使用示例

使用 FunASR 推理

from funasr import AutoModel
model = AutoModel(model="ruska1117/SenseVoiceSmall-onnx-fp16", device="cpu")
result = model.generate(input="audio.wav", language="auto")

仅用 ONNX Runtime 加载

需按 FunASR 的前处理(如 WavFrontend、LFR、cmvn)准备输入,再调用 ONNX 推理;一般推荐通过 FunASR 使用。

许可证与致谢

引用

若使用 SenseVoice,请引用原项目:

@article{sensevoice,
  title={SenseVoice: Multilingual Speech Foundation Model},
  author={FunAudioLLM Team},
  year={2024}
}
Downloads last month
19
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support