Spaces:

Veronyka
/

IA-youtube-transcript

Sleeping

App Files Files Community

travahacker commited on 17 days ago

Commit

8985e44

1 Parent(s): 31cb808

feat: usa legendas do YouTube como método principal (funciona para qualquer pessoa)

Browse files

- youtube-transcript-api para vídeos com legendas (sem 403)
- fallback: yt-dlp + Whisper para vídeos sem legendas

Files changed (3) hide show

README.md +8 -6
app.py +75 -18
requirements.txt +2 -1

README.md CHANGED Viewed

@@ -6,21 +6,23 @@ colorTo: purple
 sdk: gradio
 sdk_version: 4.44.0
 app_file: app.py
-hardware: zerogpu
 pinned: false
 license: mit
 ---
-# Transcrição YouTube com Whisper
-Cola o link do YouTube, escolhe o modelo Whisper e transcreve. **100% local na GPU** (ZeroGPU).
 ## Como usar
-1. Cole o link do vídeo
-2. Escolha o modelo (small = bom equilíbrio)
 3. Clique em Transcrever
-4. Aguarde (pode levar 1–2 min na fila da GPU)
 ## Requisitos

 sdk: gradio
 sdk_version: 4.44.0
 app_file: app.py
 pinned: false
 license: mit
 ---
+# Transcrição YouTube
+Cola o link do YouTube e transcreve. **Funciona para qualquer pessoa**, de qualquer computador.
+- **Legendas do YouTube** (prioridade): usa legendas quando disponíveis — rápido, sem download
+- **Whisper** (fallback): quando o vídeo não tem legendas, usa yt-dlp + Whisper na GPU
 ## Como usar
+1. Cole o link do vídeo (ex: https://youtu.be/HidI2dvdTMw)
+2. Escolha o idioma preferido (ou Auto)
 3. Clique em Transcrever
+4. Se houver legendas: resultado em segundos. Sem legendas: aguarde a fila da GPU (1–2 min)
 ## Requisitos

app.py CHANGED Viewed

@@ -1,8 +1,10 @@
 """
-Transcrição YouTube com Whisper — ZeroGPU Space
-Cola o link, escolhe o modelo, transcreve. Usa ZeroGPU para processamento.
 """
 import subprocess
 import tempfile
 from pathlib import Path
@@ -21,16 +23,55 @@ except ImportError:
     spaces = _Spaces()
 def baixar_audio(url: str, pasta: Path) -> Path:
-    """Baixa áudio do YouTube com yt-dlp."""
     pasta.mkdir(parents=True, exist_ok=True)
     out = pasta / "audio.%(ext)s"
     cmd = [
-        "yt-dlp", "-x", "--audio-format", "wav", "--audio-quality", "0",
-        "-o", str(out), "--no-playlist", url,
     ]
-    subprocess.run(cmd, check=True, capture_output=True, text=True)
-    for ext in [".wav", ".m4a", ".webm", ".opus"]:
         p = pasta / f"audio{ext}"
         if p.exists():
             return p
@@ -41,22 +82,35 @@ def baixar_audio(url: str, pasta: Path) -> Path:
 @spaces.GPU(duration=180)
-def transcrever_gpu(url: str, modelo: str, idioma: str) -> str:
     """
-    Transcreve vídeo do YouTube. Roda na GPU (ZeroGPU).
-    duration=180: vídeos até ~3min; aumente para vídeos mais longos.
     """
-    from faster_whisper import WhisperModel
-    if not url or ("youtube.com" not in url and "youtu.be" not in url):
         return "❌ Cole um link válido do YouTube."
     with tempfile.TemporaryDirectory() as tmpdir:
         pasta = Path(tmpdir)
         try:
             audio_path = baixar_audio(url, pasta)
         except Exception as e:
-            return f"❌ Erro ao baixar: {e}"
         model = WhisperModel(modelo, device="cuda", compute_type="float16")
         lang = None if idioma == "Auto" else idioma.lower()
@@ -80,7 +134,7 @@ def transcrever_gpu(url: str, modelo: str, idioma: str) -> str:
     if not texto:
         return "⚠️ Nenhum texto transcrito (vídeo sem fala?)."
-    return f"Idioma detectado: {info.language}\n\n{texto}"
 MODELOS = ["tiny", "base", "small", "medium", "large-v3"]
@@ -91,12 +145,15 @@ with gr.Blocks(
     theme=gr.themes.Soft(),
 ) as demo:
     gr.Markdown("# 🎙️ Transcrição YouTube")
-    gr.Markdown("Cola o link, escolhe o modelo Whisper. **ZeroGPU** — processamento gratuito na nuvem.")
     with gr.Row():
         url = gr.Textbox(
             label="Link do YouTube",
-            placeholder="https://www.youtube.com/watch?v=...",
             scale=3,
         )
     with gr.Row():
@@ -121,7 +178,7 @@ with gr.Blocks(
     )
     btn.click(
-        fn=transcrever_gpu,
         inputs=[url, modelo, idioma],
         outputs=saida,
     )

 """
+Transcrição YouTube — ZeroGPU Space
+Cola o link, transcreve. Usa legendas do YouTube quando disponíveis (rápido, sem GPU).
+Fallback: Whisper quando o vídeo não tem legendas.
 """
+import re
 import subprocess
 import tempfile
 from pathlib import Path
     spaces = _Spaces()
+def extrair_video_id(url: str) -> str | None:
+    """Extrai o ID do vídeo de uma URL do YouTube."""
+    if not url or ("youtube.com" not in url and "youtu.be" not in url):
+        return None
+    m = re.search(r"(?:youtube\.com/watch\?v=|youtu\.be/)([a-zA-Z0-9_-]{11})", url)
+    return m.group(1) if m else None
+def transcrever_via_legendas(video_id: str, idioma: str) -> tuple[str | None, str | None]:
+    """
+    Busca legendas diretamente do YouTube (sem baixar vídeo).
+    Retorna (texto, None) em sucesso ou (None, mensagem_erro) em falha.
+    """
+    from youtube_transcript_api import YouTubeTranscriptApi
+    from youtube_transcript_api._errors import NoTranscriptFound, RequestBlocked, IpBlocked
+    lang_codes = []
+    if idioma != "Auto":
+        lang_codes = [idioma.lower()]
+    lang_codes.extend(["pt", "en", "es", "fr"])  # fallbacks
+    try:
+        api = YouTubeTranscriptApi()
+        transcript = api.fetch(video_id, languages=lang_codes)
+        linhas = [s.text for s in transcript if s.text.strip()]
+        return "\n".join(linhas), None
+    except NoTranscriptFound:
+        return None, "Este vídeo não tem legendas disponíveis."
+    except (RequestBlocked, IpBlocked):
+        return None, "YouTube bloqueou o acesso (IP de datacenter). Tente mais tarde."
+    except Exception as e:
+        return None, str(e)
 def baixar_audio(url: str, pasta: Path) -> Path:
+    """Baixa áudio do YouTube com yt-dlp (fallback quando não há legendas)."""
     pasta.mkdir(parents=True, exist_ok=True)
     out = pasta / "audio.%(ext)s"
     cmd = [
+        "yt-dlp", "-x", "--audio-format", "m4a",
+        "-o", str(out), "--no-playlist", "--no-warnings",
+        "--no-check-certificate",
+        url,
     ]
+    result = subprocess.run(cmd, capture_output=True, text=True, timeout=300)
+    if result.returncode != 0:
+        err = (result.stderr or result.stdout or "").strip()
+        raise RuntimeError(f"yt-dlp falhou: {err or 'erro desconhecido'}")
+    for ext in [".m4a", ".opus", ".webm", ".wav", ".mp3"]:
         p = pasta / f"audio{ext}"
         if p.exists():
             return p
 @spaces.GPU(duration=180)
+def transcrever(url: str, modelo: str, idioma: str) -> str:
     """
+    Transcreve vídeo do YouTube.
+    1. Tenta legendas do YouTube (rápido, sem GPU, funciona para qualquer pessoa)
+    2. Se não houver legendas, usa yt-dlp + Whisper (GPU)
     """
+    video_id = extrair_video_id(url)
+    if not video_id:
         return "❌ Cole um link válido do YouTube."
+    # 1. Tentar legendas primeiro (funciona para ~85% dos vídeos, qualquer usuário)
+    texto, erro = transcrever_via_legendas(video_id, idioma)
+    if texto:
+        return f"📋 Legendas do YouTube\n\n{texto}"
+    # 2. Fallback: yt-dlp + Whisper (pode falhar com 403 em alguns ambientes)
+    return transcrever_com_whisper(url, modelo, idioma, msg_sem_legendas=erro)
+def transcrever_com_whisper(url: str, modelo: str, idioma: str, msg_sem_legendas: str = "") -> str:
+    """Transcreve com Whisper (baixa áudio via yt-dlp). Usa GPU."""
+    from faster_whisper import WhisperModel
     with tempfile.TemporaryDirectory() as tmpdir:
         pasta = Path(tmpdir)
         try:
             audio_path = baixar_audio(url, pasta)
         except Exception as e:
+            return f"❌ Erro ao baixar: {e}\n\n💡 {msg_sem_legendas or 'Vídeo sem legendas — o download pode falhar (403) em servidores.'}"
         model = WhisperModel(modelo, device="cuda", compute_type="float16")
         lang = None if idioma == "Auto" else idioma.lower()
     if not texto:
         return "⚠️ Nenhum texto transcrito (vídeo sem fala?)."
+    return f"🎙️ Whisper — Idioma detectado: {info.language}\n\n{texto}"
 MODELOS = ["tiny", "base", "small", "medium", "large-v3"]
     theme=gr.themes.Soft(),
 ) as demo:
     gr.Markdown("# 🎙️ Transcrição YouTube")
+    gr.Markdown(
+        "Cola o link e transcreve. **Legendas do YouTube** quando disponíveis (rápido, qualquer vídeo). "
+        "Sem legendas: usa Whisper (ZeroGPU)."
+    )
     with gr.Row():
         url = gr.Textbox(
             label="Link do YouTube",
+            placeholder="https://youtu.be/HidI2dvdTMw",
             scale=3,
         )
     with gr.Row():
     )
     btn.click(
+        fn=transcrever,
         inputs=[url, modelo, idioma],
         outputs=saida,
     )

requirements.txt CHANGED Viewed

@@ -1,4 +1,5 @@
 gradio>=4.0.0
 huggingface_hub>=0.20.0,<0.23.0
 faster-whisper>=1.0.0
-yt-dlp>=2024.1.0

 gradio>=4.0.0
 huggingface_hub>=0.20.0,<0.23.0
 faster-whisper>=1.0.0
+yt-dlp>=2024.12.0
+youtube-transcript-api>=1.2.0