Spaces:

Veronyka
/

IA-youtube-transcript

Paused

App Files Files Community

travahacker commited on Feb 5

Commit

802caeb

1 Parent(s): 6c21c8a

fix: corrige internal server error - gr.File, tratamento de erros

Browse files

Files changed (1) hide show

app.py +44 -30

app.py CHANGED Viewed

@@ -3,8 +3,8 @@ Transcrição de áudio — ZeroGPU Space
 Envie um arquivo de áudio (mp3, wav, m4a, etc.) e transcreva com Whisper.
 """
 from pathlib import Path
 import gradio as gr
 # ZeroGPU: decorator é no-op fora do HF
@@ -20,36 +20,51 @@ except ImportError:
 @spaces.GPU(duration=180)
-def transcrever(audio: str | None, modelo: str, idioma: str) -> str:
     """Transcreve áudio enviado com Whisper."""
-    from faster_whisper import WhisperModel
-    if not audio or not Path(audio).exists():
-        return "❌ Envie um arquivo de áudio."
-    model = WhisperModel(modelo, device="cuda", compute_type="float16")
-    lang = None if idioma == "Auto" else idioma.lower()
-    segments, info = model.transcribe(
-        audio,
-        language=lang,
-        beam_size=5,
-        vad_filter=True,
-    )
-    resultado = []
-    for seg in segments:
-        resultado.append({
-            "start": seg.start,
-            "end": seg.end,
-            "text": seg.text.strip(),
-        })
-    texto = "\n".join(s["text"] for s in resultado if s["text"])
-    if not texto:
-        return "⚠️ Nenhum texto transcrito (áudio sem fala?)."
-    return f"Idioma detectado: {info.language}\n\n{texto}"
 MODELOS = ["tiny", "base", "small", "medium", "large-v3"]
@@ -66,10 +81,9 @@ with gr.Blocks(
     )
     with gr.Row():
-        audio = gr.Audio(
             label="Áudio",
-            type="filepath",
-            sources=["upload"],
         )
     with gr.Row():
         modelo = gr.Dropdown(
@@ -104,4 +118,4 @@ with gr.Blocks(
         "A transcrição pode levar 1–2 min para iniciar (fila da GPU)."
     )
-demo.launch()

 Envie um arquivo de áudio (mp3, wav, m4a, etc.) e transcreva com Whisper.
 """
+import tempfile
 from pathlib import Path
 import gradio as gr
 # ZeroGPU: decorator é no-op fora do HF
 @spaces.GPU(duration=180)
+def transcrever(audio, modelo: str, idioma: str) -> str:
     """Transcreve áudio enviado com Whisper."""
+    try:
+        from faster_whisper import WhisperModel
+        path = None
+        if isinstance(audio, str) and audio and Path(audio).exists():
+            path = str(audio)
+        elif hasattr(audio, "name"):
+            p = getattr(audio, "name", None)
+            if p and Path(str(p)).exists():
+                path = str(p)
+        elif isinstance(audio, bytes) and audio:
+            with tempfile.NamedTemporaryFile(suffix=".mp3", delete=False) as f:
+                f.write(audio)
+                path = f.name
+        if not path:
+            return "❌ Envie um arquivo de áudio."
+        model = WhisperModel(modelo, device="cuda", compute_type="float16")
+        lang = None if idioma == "Auto" else idioma.lower()
+        segments, info = model.transcribe(
+            path,
+            language=lang,
+            beam_size=5,
+            vad_filter=True,
+        )
+        resultado = []
+        for seg in segments:
+            resultado.append({
+                "start": seg.start,
+                "end": seg.end,
+                "text": seg.text.strip(),
+            })
+        texto = "\n".join(s["text"] for s in resultado if s["text"])
+        if not texto:
+            return "⚠️ Nenhum texto transcrito (áudio sem fala?)."
+        return f"Idioma detectado: {info.language}\n\n{texto}"
+    except Exception as e:
+        return f"❌ Erro: {type(e).__name__}: {e}"
 MODELOS = ["tiny", "base", "small", "medium", "large-v3"]
     )
     with gr.Row():
+        audio = gr.File(
             label="Áudio",
+            file_types=["audio"],
         )
     with gr.Row():
         modelo = gr.Dropdown(
         "A transcrição pode levar 1–2 min para iniciar (fila da GPU)."
     )
+demo.launch(show_error=True)