Spaces:

palli23
/

ASR_API

Running on Zero

App Files Files Community

palli23 commited on Nov 30, 2025

Commit

67163c1

1 Parent(s): 860aaf0

diarization1Mæló

Browse files

Files changed (1) hide show

app.py +18 -16

app.py CHANGED Viewed

@@ -1,12 +1,12 @@
-# app.py – Whisper-small + Mælendagreining (pyannote 3.1) – VIRKAR Á ZeroGPU
 import os
 import gradio as gr
 import spaces
 from transformers import pipeline
 from pyannote.audio import Pipeline
-import tempfile
 import torch
-from torch.serialization import safe_globals
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
@@ -15,8 +15,11 @@ def transcribe_with_diarization(audio_path):
     if not audio_path:
         return "Hladdu upp hljóðskrá"
-    # LÖGUM PyTorch 2.6+ unpickling villuna
-    with safe_globals([torch.torch_version.TorchVersion]):
         diarization = Pipeline.from_pretrained(
             "pyannote/speaker-diarization-3.1",
             token=os.getenv("HF_TOKEN")
@@ -24,6 +27,7 @@ def transcribe_with_diarization(audio_path):
     dia = diarization(audio_path)
     asr = pipeline(
         "automatic-speech-recognition",
         model=MODEL_NAME,
@@ -35,23 +39,21 @@ def transcribe_with_diarization(audio_path):
     for turn, _, speaker in dia.itertracks(yield_label=True):
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as f:
             dia.crop(audio_path, turn).export(f.name, format="wav")
-            seg = f.name
-        text = asr(seg)["text"].strip()
         result.append(f"[MÆLENDI {speaker}] {text}")
-        os.unlink(seg)
     return "\n".join(result) or "Ekkert heyrt"
 with gr.Blocks() as demo:
     gr.Markdown("# Íslenskt ASR + Mælendagreining")
-    gr.Markdown("**Whisper-small + pyannote 3.1 · Keyrir á A100**")
-    gr.Markdown("Fullkominn podcast-transcript með réttum mælendum")
-    audio = gr.Audio(type="filepath", label="Hladdu upp .mp3 / .wav")
-    btn = gr.Button("Transcribe með mælendum", variant="primary", size="lg")
-    out = gr.Textbox(lines=35, label="Útskrift")
-    btn.click(transcribe_with_diarization, audio, out)
-demo.launch(auth=("beta", "beta2025"))

+# app.py – FIXED Pyannote UnpicklingError (PyTorch 2.6+ Compatible)
 import os
 import gradio as gr
 import spaces
 from transformers import pipeline
 from pyannote.audio import Pipeline
 import torch
+import tempfile
+from torch.serialization import safe_globals  # ← KEY FIX
 MODEL_NAME = "palli23/whisper-small-sam_spjall"
     if not audio_path:
         return "Hladdu upp hljóðskrá"
+    # FIX: Allowlist blocked globals for PyTorch 2.6+
+    with safe_globals([
+        torch.torch_version.TorchVersion,
+        'pyannote.audio.core.task.Specifications'  # Add if needed
+    ]):
         diarization = Pipeline.from_pretrained(
             "pyannote/speaker-diarization-3.1",
             token=os.getenv("HF_TOKEN")
     dia = diarization(audio_path)
+    # Whisper-small
     asr = pipeline(
         "automatic-speech-recognition",
         model=MODEL_NAME,
     for turn, _, speaker in dia.itertracks(yield_label=True):
         with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as f:
             dia.crop(audio_path, turn).export(f.name, format="wav")
+            segment_path = f.name
+        text = asr(segment_path)["text"].strip()
         result.append(f"[MÆLENDI {speaker}] {text}")
+        os.unlink(segment_path)
     return "\n".join(result) or "Ekkert heyrt"
+# Interface
 with gr.Blocks() as demo:
     gr.Markdown("# Íslenskt ASR + Mælendagreining")
+    gr.Markdown("**Whisper-small + pyannote 3.1 · Fixed PyTorch 2.6+**")
+    audio = gr.Audio(type="filepath")
+    btn = gr.Button("Transcribe með mælendum", variant="primary")
+    out = gr.Textbox(lines=35)
+    btn.click(transcribe_with_diarization