Spaces:

Veronyka
/

IA-youtube-transcript

Paused

App Files Files Community

travahacker commited on Feb 5

Commit

18fd051

1 Parent(s): 8ceb1f3

Add transcrição YouTube com Whisper (ZeroGPU)

Browse files

Files changed (4) hide show

README.md +27 -7
app.py +135 -0
packages.txt +1 -0
requirements.txt +3 -0

README.md CHANGED Viewed

@@ -1,13 +1,33 @@
 ---
-title: IA Youtube Transcript
-emoji: 📈
-colorFrom: green
-colorTo: gray
 sdk: gradio
-sdk_version: 6.5.1
-python_version: '3.12'
 app_file: app.py
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: Transcrição YouTube
+emoji: 🎙️
+colorFrom: blue
+colorTo: purple
 sdk: gradio
+sdk_version: 4.44.0
 app_file: app.py
+hardware: zerogpu
 pinned: false
+license: mit
 ---
+# Transcrição YouTube com Whisper
+Cola o link do YouTube, escolhe o modelo Whisper e transcreve. **100% local na GPU** (ZeroGPU).
+## Como usar
+1. Cole o link do vídeo
+2. Escolha o modelo (small = bom equilíbrio)
+3. Clique em Transcrever
+4. Aguarde (pode levar 1–2 min na fila da GPU)
+## Requisitos
+- **ZeroGPU**: Este Space usa ZeroGPU. Ao criar, selecione **ZeroGPU** no hardware.
+- **Conta PRO** necessária para *criar* Spaces ZeroGPU. Qualquer um pode *usar* o Space.
+## Quota
+- Conta grátis: ~3.5 min de GPU/dia
+- PRO: ~25 min/dia

app.py ADDED Viewed

	@@ -0,0 +1,135 @@

+"""
+Transcrição YouTube com Whisper — ZeroGPU Space
+Cola o link, escolhe o modelo, transcreve. Usa ZeroGPU para processamento.
+"""
+import subprocess
+import tempfile
+from pathlib import Path
+import gradio as gr
+# ZeroGPU: decorator é no-op fora do HF
+try:
+    import spaces
+except ImportError:
+    class _Spaces:
+        def GPU(self, fn=None, **kwargs):
+            def decorator(f):
+                return f
+            return decorator(fn) if fn else decorator
+    spaces = _Spaces()
+def baixar_audio(url: str, pasta: Path) -> Path:
+    """Baixa áudio do YouTube com yt-dlp."""
+    pasta.mkdir(parents=True, exist_ok=True)
+    out = pasta / "audio.%(ext)s"
+    cmd = [
+        "yt-dlp", "-x", "--audio-format", "wav", "--audio-quality", "0",
+        "-o", str(out), "--no-playlist", url,
+    ]
+    subprocess.run(cmd, check=True, capture_output=True, text=True)
+    for ext in [".wav", ".m4a", ".webm", ".opus"]:
+        p = pasta / f"audio{ext}"
+        if p.exists():
+            return p
+    for f in pasta.iterdir():
+        if f.suffix.lower() in (".wav", ".m4a", ".webm", ".opus", ".mp3"):
+            return f
+    raise FileNotFoundError("Áudio não encontrado após download")
+@spaces.GPU(duration=180)
+def transcrever_gpu(url: str, modelo: str, idioma: str) -> str:
+    """
+    Transcreve vídeo do YouTube. Roda na GPU (ZeroGPU).
+    duration=180: vídeos até ~3min; aumente para vídeos mais longos.
+    """
+    from faster_whisper import WhisperModel
+    if not url or ("youtube.com" not in url and "youtu.be" not in url):
+        return "❌ Cole um link válido do YouTube."
+    with tempfile.TemporaryDirectory() as tmpdir:
+        pasta = Path(tmpdir)
+        try:
+            audio_path = baixar_audio(url, pasta)
+        except Exception as e:
+            return f"❌ Erro ao baixar: {e}"
+        model = WhisperModel(modelo, device="cuda", compute_type="float16")
+        lang = None if idioma == "Auto" else idioma.lower()
+        segments, info = model.transcribe(
+            str(audio_path),
+            language=lang,
+            beam_size=5,
+            vad_filter=True,
+        )
+        resultado = []
+        for seg in segments:
+            resultado.append({
+                "start": seg.start,
+                "end": seg.end,
+                "text": seg.text.strip(),
+            })
+    texto = "\n".join(s["text"] for s in resultado if s["text"])
+    if not texto:
+        return "⚠️ Nenhum texto transcrito (vídeo sem fala?)."
+    return f"Idioma detectado: {info.language}\n\n{texto}"
+MODELOS = ["tiny", "base", "small", "medium", "large-v3"]
+IDIOMAS = ["Auto", "pt", "en", "es", "fr"]
+with gr.Blocks(
+    title="Transcrição YouTube",
+    theme=gr.themes.Soft(),
+) as demo:
+    gr.Markdown("# 🎙️ Transcrição YouTube")
+    gr.Markdown("Cola o link, escolhe o modelo Whisper. **ZeroGPU** — processamento gratuito na nuvem.")
+    with gr.Row():
+        url = gr.Textbox(
+            label="Link do YouTube",
+            placeholder="https://www.youtube.com/watch?v=...",
+            scale=3,
+        )
+    with gr.Row():
+        modelo = gr.Dropdown(
+            label="Modelo Whisper",
+            choices=MODELOS,
+            value="small",
+            info="small = bom equilíbrio; large-v3 = mais preciso (mais lento)",
+        )
+        idioma = gr.Dropdown(
+            label="Idioma",
+            choices=IDIOMAS,
+            value="Auto",
+        )
+    btn = gr.Button("Transcrever", variant="primary")
+    saida = gr.Textbox(
+        label="Transcrição",
+        lines=15,
+        max_lines=30,
+    )
+    btn.click(
+        fn=transcrever_gpu,
+        inputs=[url, modelo, idioma],
+        outputs=saida,
+    )
+    gr.Markdown("---")
+    gr.Markdown(
+        "**Uso de quota ZeroGPU:** ~3.5 min/dia (conta grátis). "
+        "A transcrição pode levar 1–2 min para iniciar (fila da GPU)."
+    )
+demo.launch()

packages.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ ffmpeg

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+gradio>=4.0.0
+faster-whisper>=1.0.0
+yt-dlp>=2024.1.0