automatic-speech-recognition

Running

csukuangfj commited on 23 days ago

Commit

7ee0369

1 Parent(s): d6e8fba

add funasr nano

Files changed (1) hide show

model.py CHANGED Viewed

@@ -21,6 +21,8 @@ from typing import Union
 import torch
 import torchaudio
 from huggingface_hub import hf_hub_download
 os.system("find / -name libk2*.so 2>/dev/null")
@@ -2062,6 +2064,35 @@ def _get_chinese_dialect_models(
     return recognizer
 @lru_cache(maxsize=10)
 def _get_sense_voice_pre_trained_model(
     repo_id: str,
@@ -2323,8 +2354,7 @@ english_models = {
 }
 funsar_nano_31_languages_models = {
-    "csukuangfj/sherpa-onnx-sense-voice-funasr-nano-int8-2025-12-17": _get_sense_voice_pre_trained_model,
-    "csukuangfj/sherpa-onnx-sense-voice-funasr-nano-2025-12-17": _get_sense_voice_pre_trained_model,
 }
 medical_english_models = {

 import torch
 import torchaudio
 from huggingface_hub import hf_hub_download
+from huggingface_hub import snapshot_download
 os.system("find / -name libk2*.so 2>/dev/null")
     return recognizer
+@lru_cache(maxsize=10)
+def _get_funasr_nano(
+    repo_id: str,
+    decoding_method: str,
+    num_active_paths: int,
+) -> sherpa_onnx.OfflineRecognizer:
+    assert repo_id in [
+        "csukuangfj/sherpa-onnx-funasr-nano-int8-2025-12-30",
+    ], repo_id
+    local_dir = snapshot_download(repo_id)
+    encoder_adaptor = f"{local_dir}/encoder_adaptor.int8.onnx"
+    llm_prefill = f"{local_dir}/llm_prefill.int8.onnx"
+    llm_decode = f"{local_dir}/llm_decode.int8.onnx"
+    embedding = f"{local_dir}/embedding.int8.onnx"
+    tokenizer = f"{local_dir}/Qwen3-0.6B"
+    return sherpa_onnx.OfflineRecognizer.from_funasr_nano(
+        encoder_adaptor=encoder_adaptor,
+        llm_prefill=llm_prefill,
+        llm_decode=llm_decode,
+        embedding=embedding,
+        tokenizer=tokenizer,
+        num_threads=2,
+        debug=True,
+    )
 @lru_cache(maxsize=10)
 def _get_sense_voice_pre_trained_model(
     repo_id: str,
 }
 funsar_nano_31_languages_models = {
+    "csukuangfj/sherpa-onnx-funasr-nano-int8-2025-12-30": _get_funasr_nano,
 }
 medical_english_models = {