ASR_API2

Sleeping

App Files Files Community

palli23 commited on Nov 30, 2025

Commit

365da29

1 Parent(s): 2767a40

update3

Browse files

Files changed (2) hide show

app.py +41 -45
requirements.txt +2 -1

app.py CHANGED Viewed

@@ -1,57 +1,53 @@
-# app.py – FIXED timestamps villa (virkar 100 %)
 import os
 import gradio as gr
 from transformers import pipeline
-import warnings
-warnings.filterwarnings("ignore")
-print("Hleð Whisper-small...")
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
-pipe = pipeline(
-    "automatic-speech-recognition",
-    model=MODEL_NAME,
-    device=-1,  # CPU fyrst (þú getur breytt í 0 þegar GPU virkar)
-    token=os.getenv("HF_TOKEN")
-)
-# FIX FOR TIMESTAMPS – settu þetta hér
-model = pipe.model
-processor = pipe.tokenizer
-# Setja upp timestamps config (lagar villuna)
-if not hasattr(model.generation_config, 'no_timestamps_token_id'):
-    model.generation_config.no_timestamps_token_id = processor.convert_tokens_to_ids("<|notimestamps|>")
-model.generation_config.predict_timestamps = True
-print("Timestamps fix sett upp – núna virkar return_timestamps=True")
-def transcribe(audio):
-    if not audio:
-        return "Hladdu upp hljóð"
     try:
-        # Generate með timestamps (núna virkar!)
-        result = pipe(audio, return_timestamps=True, chunk_length_s=30, stride_length_s=(6, 3))
-        # Flettum timestamps
-        if "chunks" in result:
-            full_text = ""
-            for chunk in result["chunks"]:
-                full_text += f"[{chunk['timestamp'][0]:.1f}s - {chunk['timestamp'][1]:.1f}s]: {chunk['text']}\n"
-            return full_text
-        else:
-            return result["text"]
     except Exception as e:
         return f"Villa: {str(e)}"
-with gr.Blocks() as demo:
-    gr.Markdown("# Íslenskt ASR – Timestamps Virkar!")
-    gr.Markdown("Whisper-small · ~4–5 % WER · Með tímasetningum")
-    audio = gr.Audio(type="filepath")
-    btn = gr.Button("Transcribe með timestamps")
-    out = gr.Textbox(lines=25)
-    btn.click(transcribe, audio, out)
-demo.launch(auth=("beta", "beta2025"))

+# app.py – Íslenskt ASR með ZeroGPU (A100/T4) – PRO Spaces
 import os
 import gradio as gr
+import spaces  # MÁGÍSKUR – gefur þér GPU í PRO
 from transformers import pipeline
+# ÞITT private Whisper-small model
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
+# ZeroGPU decorator – þetta gefur þér A100/T4 strax
+@spaces.GPU
+def transcribe(audio_path):
+    if not audio_path:
+        return "Hladdu upp hljóðskrá fyrst"
+    # Módel hleðst bara einu sinni (cached)
+    pipe = pipeline(
+        "automatic-speech-recognition",
+        model=MODEL_NAME,
+        device=0,  # GPU
+        token=os.getenv("HF_TOKEN")  # þarf fyrir private model
+    )
     try:
+        result = pipe(audio_path, batch_size=8)
+        return result["text"]
     except Exception as e:
         return f"Villa: {str(e)}"
+# Fallegt Gradio interface
+with gr.Blocks(theme=gr.themes.Soft(), title="Íslenskt ASR – ZeroGPU") as demo:
+    gr.Markdown("# Íslenskt ASR – 0.2× RTF á A100")
+    gr.Markdown("**Whisper-small · ~4 % WER · Keyrir á ZeroGPU (PRO)**")
+    gr.Markdown("Hladdu upp podcast/fréttir – færð texta á 10–25 sekúndum")
+    audio_input = gr.Audio(
+        type="filepath",
+        label="Hladdu upp .mp3 / .wav / .m4a"
+    )
+    btn = gr.Button("Transcribe", variant="primary", size="lg")
+    output = gr.Textbox(lines=25, label="Útskrift")
+    btn.click(transcribe, inputs=audio_input, outputs=output)
+    gr.Markdown("© 2025 – Einkaeign · Engin gögn vistuð")
+# Lykilorð + ZeroGPU
+demo.launch(
+    auth=("beta", "beta2025"),   # breyttu í sterkara lykilorð þegar þú vilt
+    server_name="0.0.0.0",
+    server_port=7860
+)

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 gradio
 transformers
-torch

 gradio
 transformers
+torch
+spaces