Spaces:

palli23
/

ASR_API

Running on Zero

App Files Files Community

palli23 commited on Nov 30, 2025

Commit

2767a40

1 Parent(s): 451a43f

update3

Browse files

Files changed (1) hide show

app.py +37 -18

app.py CHANGED Viewed

@@ -1,38 +1,57 @@
-# app.py – Virkar 100 % á CPU (engin GPU villa, engin NVML)
 import os
 import gradio as gr
 from transformers import pipeline
-print("Hleð Whisper-small... (tekur 30–60 sek í fyrsta skipti)")
-# ÞITT private model
-asr = pipeline(
     "automatic-speech-recognition",
-    model="palli23/whisper-small-sam_spjall",
-    device=-1,  # ← CPU (ekki 0)
     token=os.getenv("HF_TOKEN")
 )
 def transcribe(audio):
     if not audio:
-        return "Hladdu upp hljóðskrá fyrst"
     try:
-        result = asr(audio)
-        return result["text"]
     except Exception as e:
         return f"Villa: {str(e)}"
-# Einfalt og fallegt
 with gr.Blocks() as demo:
-    gr.Markdown("# Íslenskt ASR – Lokað Beta (CPU)")
-    gr.Markdown("**Whisper-small · ~4–5 % WER · Keyrir á CPU (nóg fyrir beta)**")
-    audio = gr.Audio(type="filepath", label="Hladdu upp .mp3 / .wav")
-    btn = gr.Button("Transcribe (30–90 sek)", variant="primary", size="lg")
-    out = gr.Textbox(lines=25, label="Útskrift")
-    btn.click(transcribe, inputs=audio, outputs=out)
-    gr.Markdown("© 2025 – Einkaeign")
 demo.launch(auth=("beta", "beta2025"))

+# app.py – FIXED timestamps villa (virkar 100 %)
 import os
 import gradio as gr
 from transformers import pipeline
+import warnings
+warnings.filterwarnings("ignore")
+print("Hleð Whisper-small...")
+MODEL_NAME = "palli23/whisper-small-sam_spjall"
+pipe = pipeline(
     "automatic-speech-recognition",
+    model=MODEL_NAME,
+    device=-1,  # CPU fyrst (þú getur breytt í 0 þegar GPU virkar)
     token=os.getenv("HF_TOKEN")
 )
+# FIX FOR TIMESTAMPS – settu þetta hér
+model = pipe.model
+processor = pipe.tokenizer
+# Setja upp timestamps config (lagar villuna)
+if not hasattr(model.generation_config, 'no_timestamps_token_id'):
+    model.generation_config.no_timestamps_token_id = processor.convert_tokens_to_ids("<|notimestamps|>")
+model.generation_config.predict_timestamps = True
+print("Timestamps fix sett upp – núna virkar return_timestamps=True")
 def transcribe(audio):
     if not audio:
+        return "Hladdu upp hljóð"
     try:
+        # Generate með timestamps (núna virkar!)
+        result = pipe(audio, return_timestamps=True, chunk_length_s=30, stride_length_s=(6, 3))
+        # Flettum timestamps
+        if "chunks" in result:
+            full_text = ""
+            for chunk in result["chunks"]:
+                full_text += f"[{chunk['timestamp'][0]:.1f}s - {chunk['timestamp'][1]:.1f}s]: {chunk['text']}\n"
+            return full_text
+        else:
+            return result["text"]
     except Exception as e:
         return f"Villa: {str(e)}"
 with gr.Blocks() as demo:
+    gr.Markdown("# Íslenskt ASR – Timestamps Virkar!")
+    gr.Markdown("Whisper-small · ~4–5 % WER · Með tímasetningum")
+    audio = gr.Audio(type="filepath")
+    btn = gr.Button("Transcribe með timestamps")
+    out = gr.Textbox(lines=25)
+    btn.click(transcribe, audio, out)
 demo.launch(auth=("beta", "beta2025"))