ASR_API2

Sleeping

App Files Files Community

palli23 commited on Dec 3, 2025

Commit

faa307f

1 Parent(s): 4f32c1f

fix transcribe bug

Browse files

Files changed (1) hide show

app.py +16 -17

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# app.py – FIXED: No waveform=True (works on old Gradio)
 import os
 import gradio as gr
 import spaces
@@ -6,7 +6,7 @@ from transformers import pipeline
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
-print("Hleð Whisper módelinu...")
 pipe = pipeline(
     "automatic-speech-recognition",
@@ -16,7 +16,7 @@ pipe = pipeline(
     token=os.getenv("HF_TOKEN")
 )
-# Fix old Whisper checkpoints
 if not hasattr(pipe.model.generation_config, "lang_to_id") or pipe.model.generation_config.lang_to_id is None:
     pipe.model.generation_config.lang_to_id = {"is": 50259}
     pipe.model.generation_config.task_to_id = {"transcribe": 50359, "translate": 50358}
@@ -27,25 +27,23 @@ print("Módel tilbúið!")
 @spaces.GPU(duration=180)
 def transcribe_single(audio_path):
     if not audio_path:
-        return None, "Hladdu upp hljóðskrá", "00:00"
     result = pipe(audio_path, chunk_length_s=30, batch_size=8)
     text = result["text"].strip()
-    return audio_path, text, None  # Clear timer when done
-with gr.Blocks(title="Íslenskt Whisper") as demo:
     gr.Markdown("# Íslenskt Whisper – Mjög lágt WER")
-    gr.Markdown("Hladdu upp einni hljóðskrá (allt að 5 mín) → smelltu á Transcribe")
-    with gr.Row():
-        audio_in = gr.Audio(label="Hljóðskrá", type="filepath")  # ← waveform=True fjarlægt
-    btn = gr.Button("Transcribe", variant="primary", size="lg")
-    with gr.Row():
-        timer = gr.Timer(180, label="Tími eftir á GPU (sek)", active=True, visible=True)
-    output = gr.Textbox(label="Útskrift", lines=20)
     btn.click(
         transcribe_single,
@@ -53,4 +51,5 @@ with gr.Blocks(title="Íslenskt Whisper") as demo:
         outputs=[audio_in, output, timer]
     )
 demo.launch(auth=("beta", "beta2025"))

+# app.py – VIRKAR Á ÖLLUM Spaces (jafnvel gömlum Gradio)
 import os
 import gradio as gr
 import spaces
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
+print("Hleð Whisper módelinu einu sinni...")
 pipe = pipeline(
     "automatic-speech-recognition",
     token=os.getenv("HF_TOKEN")
 )
+# Fix fyrir gamlar Whisper útgáfur
 if not hasattr(pipe.model.generation_config, "lang_to_id") or pipe.model.generation_config.lang_to_id is None:
     pipe.model.generation_config.lang_to_id = {"is": 50259}
     pipe.model.generation_config.task_to_id = {"transcribe": 50359, "translate": 50358}
 @spaces.GPU(duration=180)
 def transcribe_single(audio_path):
     if not audio_path:
+        return None, "Hladdu upp hljóðskrá fyrst", "00:00"
     result = pipe(audio_path, chunk_length_s=30, batch_size=8)
     text = result["text"].strip()
+    return audio_path, text, None  # Slekkur á timer þegar búið
+with gr.Blocks() as demo:
     gr.Markdown("# Íslenskt Whisper – Mjög lágt WER")
+    gr.Markdown("Hladdu upp einni skrá (allt að 5 mín) → Transcribe")
+    audio_in = gr.Audio(label="Hljóðskrá", type="filepath")  # Virkar á öllum Gradio útgáfum
+    btn       = gr.Button("Transcribe", variant="primary", size="lg")
+    # Einfaldur timer án label/active/visible (virkar á Gradio 3.x)
+    timer     = gr.Timer(value=180)
+    output    = gr.Textbox(label="Útskrift", lines=20)
     btn.click(
         transcribe_single,
         outputs=[audio_in, output, timer]
     )
+# Login: beta / beta2025
 demo.launch(auth=("beta", "beta2025"))