ASR_API2

Sleeping

palli23 commited on Dec 3, 2025

Commit

523244e

1 Parent(s): fd7965b

fix transcribe bug

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# app.py – Virkar fullkomlega á ZeroGPU + venjulegum GPU Spaces
 import os
 import gradio as gr
 import spaces
@@ -6,19 +6,23 @@ from transformers import pipeline
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
-# Látum mótið hlaðast einu sinni við ræsingu – ÞETTA ER MIKILVÆGT
 print("Hleð Whisper módelinu einu sinni...")
 pipe = pipeline(
     "automatic-speech-recognition",
     model=MODEL_NAME,
-    torch_dtype="auto",          # fínt fyrir bæði fp16 og fp32
-    device="cuda" if os.getenv("SYSTEM") == "spaces" else "cpu",  # ZeroGPU skynjar CUDA sjálfkrafa
-    model_kwargs={"attn_implementation": "sdpa"},  # hraðari á nýjum GPU-um
     token=os.getenv("HF_TOKEN")
 )
-print("Módel tilbúið – allt klárt!")
 @spaces.GPU(duration=120)
 def transcribe_audio(audio_path):
@@ -29,8 +33,9 @@ def transcribe_audio(audio_path):
         audio_path,
         chunk_length_s=30,
         batch_size=8,
-        generate_kwargs={"language": "is", "task": "transcribe"},
-        return_timestamps=False
     )
     return result["text"]

+# app.py – Fixed for outdated generation_config (virkar á ZeroGPU)
 import os
 import gradio as gr
 import spaces
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
 print("Hleð Whisper módelinu einu sinni...")
 pipe = pipeline(
     "automatic-speech-recognition",
     model=MODEL_NAME,
+    torch_dtype="auto",
+    device="cuda" if os.getenv("SYSTEM") == "spaces" else "cpu",
+    model_kwargs={"attn_implementation": "sdpa"},
     token=os.getenv("HF_TOKEN")
 )
+# *** THIS IS THE FIX: Uppfæra generation_config til að styðja language/task ***
+pipe.model.generation_config.language = "is"  # Default language
+pipe.model.generation_config.task = "transcribe"  # Default task
+pipe.model.generation_config.forced_decoder_ids = None  # Disable old forced IDs (deprecated)
+pipe.model.generation_config.suppress_tokens = []  # Clear suppress if needed
+print("Generation config uppfærð – allt klárt!")
 @spaces.GPU(duration=120)
 def transcribe_audio(audio_path):
         audio_path,
         chunk_length_s=30,
         batch_size=8,
+        return_timestamps=False,
+        # Núna virkar þetta án generate_kwargs (því config er sett)
+        # Ef þú vilt breyta: generate_kwargs={"language": "is", "task": "transcribe"}
     )
     return result["text"]