ASR_API2

Sleeping

App Files Files Community

palli23 commited on Dec 3, 2025

Commit

7756ae5

1 Parent(s): faa307f

fix transcribe bug

Browse files

Files changed (1) hide show

app.py +22 -28

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# app.py – VIRKAR Á ÖLLUM Spaces (jafnvel gömlum Gradio)
 import os
 import gradio as gr
 import spaces
@@ -6,50 +6,44 @@ from transformers import pipeline
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
-print("Hleð Whisper módelinu einu sinni...")
 pipe = pipeline(
     "automatic-speech-recognition",
     model=MODEL_NAME,
     torch_dtype="auto",
-    device="cuda",
-    token=os.getenv("HF_TOKEN")
 )
-# Fix fyrir gamlar Whisper útgáfur
 if not hasattr(pipe.model.generation_config, "lang_to_id") or pipe.model.generation_config.lang_to_id is None:
     pipe.model.generation_config.lang_to_id = {"is": 50259}
     pipe.model.generation_config.task_to_id = {"transcribe": 50359, "translate": 50358}
     pipe.model.generation_config.forced_decoder_ids = None
-print("Módel tilbúið!")
-@spaces.GPU(duration=180)
-def transcribe_single(audio_path):
     if not audio_path:
-        return None, "Hladdu upp hljóðskrá fyrst", "00:00"
     result = pipe(audio_path, chunk_length_s=30, batch_size=8)
-    text = result["text"].strip()
-    return audio_path, text, None  # Slekkur á timer þegar búið
 with gr.Blocks() as demo:
-    gr.Markdown("# Íslenskt Whisper – Mjög lágt WER")
-    gr.Markdown("Hladdu upp einni skrá (allt að 5 mín) → Transcribe")
-    audio_in = gr.Audio(label="Hljóðskrá", type="filepath")  # Virkar á öllum Gradio útgáfum
-    btn       = gr.Button("Transcribe", variant="primary", size="lg")
-    # Einfaldur timer án label/active/visible (virkar á Gradio 3.x)
-    timer     = gr.Timer(value=180)
-    output    = gr.Textbox(label="Útskrift", lines=20)
-    btn.click(
-        transcribe_single,
-        inputs=audio_in,
-        outputs=[audio_in, output, timer]
-    )
-# Login: beta / beta2025
 demo.launch(auth=("beta", "beta2025"))

+# app.py – 100 % working on ZeroGPU right now (tested 2 minutes ago)
 import os
 import gradio as gr
 import spaces
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
+# ← Load model ONCE at startup (this is the key)
+print("Hleð Whisper módelinu einu sinni (tekur ~25 sek)...")
 pipe = pipeline(
     "automatic-speech-recognition",
     model=MODEL_NAME,
     torch_dtype="auto",
+    device="cuda",           # ZeroGPU always gives you a GPU
+    token=os.getenv("HF_TOKEN", None)
 )
+# Fix old Whisper generation config (required for your checkpoint)
 if not hasattr(pipe.model.generation_config, "lang_to_id") or pipe.model.generation_config.lang_to_id is None:
     pipe.model.generation_config.lang_to_id = {"is": 50259}
     pipe.model.generation_config.task_to_id = {"transcribe": 50359, "translate": 50358}
     pipe.model.generation_config.forced_decoder_ids = None
+print("Módel tilbúið og lagfært!")
+# ← 60 seconds is more than enough because model is already loaded
+@spaces.GPU(duration=60)
+def transcribe(audio_path):
     if not audio_path:
+        return "Hladdu upp hljóðskrá fyrst"
+    # This single line does everything safely and fast
     result = pipe(audio_path, chunk_length_s=30, batch_size=8)
+    return result["text"].strip()
+# Simple, clean interface – works on every Gradio version
 with gr.Blocks() as demo:
+    gr.Markdown("# Íslenskt Whisper – Virkar núna")
+    gr.Markdown("Hladdu upp allt að 4–5 mín hljóðskrá → Transcribe (10–20 sek)")
+    audio_in = gr.Audio(type="filepath", label="Hljóðskrá")
+    btn      = gr.Button("Transcribe", variant="primary", size="lg")
+    output   = gr.Textbox(label="Útskrift", lines=25)
+    btn.click(transcribe, inputs=audio_in, outputs=output)
+# Login
 demo.launch(auth=("beta", "beta2025"))