omniASR-LLM-7B

kozakhart commited on 12 days ago

Commit

ca8582b

verified ·

1 Parent(s): 372e9fa

Update handler.py

Files changed (1) hide show

handler.py CHANGED Viewed

@@ -1,25 +1,26 @@
 # handler.py
-import io
-import torch
-from omnilingual_asr.models.inference.pipeline import ASRInferencePipeline
 class EndpointHandler:
     def __init__(self, path=""):
-        # Load ASR model/tokenizer via official helper
         self.pipeline = ASRInferencePipeline(model_card="facebook/omniASR-LLM-7B")
     def __call__(self, data):
-        # data dict may contain bytes, multipart upload, etc.
-        # Here we assume audio bytes in "inputs"
         audio_bytes = data.get("inputs")
         if not audio_bytes:
             return {"error": "no audio provided"}
-        # convert bytes to temp file, path etc.
-        import soundfile as sf
         f = io.BytesIO(audio_bytes)
         audio, sr = sf.read(f)
-        # Run transcription
         result = self.pipeline.transcribe([audio], batch_size=1)
         return {"text": result}

 # handler.py
 class EndpointHandler:
     def __init__(self, path=""):
+        # lazy import only inside init
+        from omnilingual_asr.models.inference.pipeline import ASRInferencePipeline
+        # Load the omniASR pipeline
         self.pipeline = ASRInferencePipeline(model_card="facebook/omniASR-LLM-7B")
     def __call__(self, data):
+        # import here so it doesn’t trigger during module load
+        import io
+        import soundfile as sf
+        # read raw bytes
         audio_bytes = data.get("inputs")
         if not audio_bytes:
             return {"error": "no audio provided"}
         f = io.BytesIO(audio_bytes)
         audio, sr = sf.read(f)
+        # run transcription
         result = self.pipeline.transcribe([audio], batch_size=1)
         return {"text": result}