Spaces:

palli23
/

ASR_API

Sleeping

App Files Files Community

palli23 commited on Dec 3, 2025

Commit

e37e472

1 Parent(s): 3325b0c

rollback 2 days

Browse files

Files changed (1) hide show

app.py +39 -20

app.py CHANGED Viewed

@@ -1,52 +1,71 @@
 import os
-os.environ["OMP_NUM_THREADS"] = "1"                     # Fixes libgomp + asyncio FD errors
-os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:128"  # Prevents VRAM crash
 import gradio as gr
 import spaces
 from transformers import pipeline
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
-@spaces.GPU(duration=180)  # Extra buffer for cold start
-def transcribe_3min(audio_path):
-    if not audio_path:
-        return "Hladdu upp hljóðskrá"
-    pipe = pipeline(
         "automatic-speech-recognition",
         model=MODEL_NAME,
-        device=0,
-        torch_dtype="float16",        # Keeps speed + enables real batching
-        token=os.getenv("HF_TOKEN")   # Optional – remove if no private model
     )
     result = pipe(
         audio_path,
         chunk_length_s=30,
         stride_length_s=(6, 0),
         return_timestamps=False,
-        batch_size=8
     )
     return result["text"]
 with gr.Blocks(title="Íslenskt ASR – 3 mín") as demo:
     gr.Markdown("# Íslenskt ASR – 3 mínútur")
-    gr.Markdown("**Whisper · Very low WER · 0.5–5 mín hljóð á ZeroGPU**")
-    audio = gr.Audio(type="filepath", label="Hladdu upp .mp3 / .wav (allt að 5 mín)")
     btn = gr.Button("Transcribe", variant="primary", size="lg")
-    out = gr.Textbox(lines=30, label="Útskrift")
-    btn.click(transcribe_3min, inputs=audio, outputs=out)
 demo.launch(
     auth=("beta", "beta2025"),
-    ssr_mode=False,       # Critical – stops infinite loading loop
-    show_error=True,      # Shows real errors instead of blank screen
     server_name="0.0.0.0",
     server_port=7860,
     quiet=False

+# app.py
 import os
+os.environ["OMP_NUM_THREADS"] = "1"
+os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:128"
 import gradio as gr
 import spaces
 from transformers import pipeline
+# ——————————————————————————————
+# Model loaded ONCE at startup (global)
+# ——————————————————————————————
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
+@spaces.GPU(duration=180)
+def get_pipe():
+    return pipeline(
         "automatic-speech-recognition",
         model=MODEL_NAME,
+        torch_dtype="float16",
+        device=0,                       # T4 GPU
+        token=os.getenv("HF_TOKEN"),    # Remove line if model is public
     )
+pipe = get_pipe()  # ← Loaded once when Space starts
+# ——————————————————————————————
+# Transcription function (super fast now)
+# ——————————————————————————————
+def transcribe_3min(audio_path):
+    if not audio_path:
+        return "Hladdu upp hljóðskrá"
     result = pipe(
         audio_path,
         chunk_length_s=30,
         stride_length_s=(6, 0),
+        batch_size=8,
         return_timestamps=False,
     )
     return result["text"]
+# ——————————————————————————————
+# Gradio UI
+# ——————————————————————————————
 with gr.Blocks(title="Íslenskt ASR – 3 mín") as demo:
     gr.Markdown("# Íslenskt ASR – 3 mínútur")
+    gr.Markdown("**Whisper · mjög lágur WER · allt að 5 mín hljóð**")
+    audio_in = gr.Audio(
+        type="filepath",
+        label="Hladdu upp .mp3 / .wav (max 5 mín)"
+    )
     btn = gr.Button("Transcribe", variant="primary", size="lg")
+    output = gr.Textbox(lines=30, label="Útskrift")
+    btn.click(fn=transcribe_3min, inputs=audio_in, outputs=output)
+# ——————————————————————————————
+# Stable launch (no more infinite Building)
+# ——————————————————————————————
 demo.launch(
     auth=("beta", "beta2025"),
+    ssr_mode=False,
+    show_error=True,
     server_name="0.0.0.0",
     server_port=7860,
     quiet=False