Spaces:

Offex
/

Transcripttiktok

Running

App Files Files Community

Offex commited on 4 days ago

Commit

e01627b

verified ·

1 Parent(s): f3ba37d

Update app.py

Browse files

Files changed (1) hide show

app.py +49 -40

app.py CHANGED Viewed

@@ -1,77 +1,86 @@
 import gradio as gr
 import yt_dlp
 import os
 from faster_whisper import WhisperModel
-# Global variable for model
 model = None
-def load_model_if_needed():
     global model
     if model is None:
-        print("📥 Loading Whisper Model...")
         model = WhisperModel("base", device="cpu", compute_type="int8")
-        print("✅ Model Loaded!")
     return model
-def get_audio_from_tiktok(url):
     try:
-        output_filename = "tiktok_audio"
-        if os.path.exists(f"{output_filename}.mp3"):
-            os.remove(f"{output_filename}.mp3")
         ydl_opts = {
             'format': 'bestaudio/best',
-            'outtmpl': output_filename,
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
                 'preferredquality': '192',
             }],
-            'quiet': True,
-            'no_warnings': True,
-            'user_agent': 'Mozilla/5.0'
         }
         with yt_dlp.YoutubeDL(ydl_opts) as ydl:
             ydl.download([url])
-        return f"{output_filename}.mp3"
-    except Exception as e:
-        return f"Error: {str(e)}"
-def process_tiktok(tiktok_url):
-    if not tiktok_url:
-        return "⚠️ Please enter a URL."
-    try:
-        current_model = load_model_if_needed()
     except Exception as e:
-        return f"Model Error: {str(e)}"
-    audio_path = get_audio_from_tiktok(tiktok_url)
-    if not audio_path.endswith(".mp3"):
-        return f"Download Error: {audio_path}"
     try:
-        segments, info = current_model.transcribe(audio_path, beam_size=5)
-        full_text = " ".join([segment.text for segment in segments])
-        return full_text.strip()
     except Exception as e:
         return f"Transcription Error: {str(e)}"
-# --- UI Fixed for Gradio 6.0 ---
-with gr.Blocks() as demo:
     gr.Markdown("# 🚀 Turbo TikTok Transcriber")
     with gr.Row():
-        url_input = gr.Textbox(label="TikTok URL", placeholder="Paste link here...")
-        run_btn = gr.Button("Transcribe", variant="primary")
-    # Error fix: 'show_copy_button' removed as it's causing the crash
-    output_text = gr.Textbox(label="Transcript", lines=10)
-    run_btn.click(fn=process_tiktok, inputs=url_input, outputs=output_text)
-# Error fix: Theme moved to launch()
-demo.launch(theme=gr.themes.Soft())

 import gradio as gr
 import yt_dlp
 import os
+import shutil
 from faster_whisper import WhisperModel
+# 1. Model Setup
 model = None
+def load_model():
     global model
     if model is None:
+        print("Loading Whisper Model...")
         model = WhisperModel("base", device="cpu", compute_type="int8")
+        print("Model Loaded!")
     return model
+# 2. Audio Download Function (Fixed FFmpeg Issue)
+def get_audio(url):
     try:
+        output = "tiktok_audio"
+        # Purani files safai
+        if os.path.exists(f"{output}.mp3"): os.remove(f"{output}.mp3")
+        # FFmpeg ka path dhoondo (System me kahan hai)
+        ffmpeg_path = shutil.which("ffmpeg") or "/usr/bin/ffmpeg"
         ydl_opts = {
             'format': 'bestaudio/best',
+            'outtmpl': output,
+            'ffmpeg_location': ffmpeg_path,  # <--- Fix: FFmpeg ka pakka rasta
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
                 'preferredquality': '192',
             }],
+            'quiet': False, # Logs dikhayega agar error aaye
+            'no_warnings': False,
+            # TikTok Block Bypass Headers
+            'http_headers': {
+                'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 14_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Mobile/15E148 Safari/604.1',
+                'Referer': 'https://www.tiktok.com/'
+            }
         }
         with yt_dlp.YoutubeDL(ydl_opts) as ydl:
             ydl.download([url])
+        return f"{output}.mp3"
     except Exception as e:
+        # Error ko saaf dikhane ke liye
+        return f"Download Error: {str(e)}"
+# 3. Transcription Function
+def transcribe(url):
+    if not url: return "⚠️ URL missing!"
+    print(f"Processing: {url}")
+    audio = get_audio(url)
+    # Agar audio file nahi bani, to error wapas karo
+    if not audio.endswith(".mp3"):
+        return f"❌ {audio}"
     try:
+        current_model = load_model()
+        segments, _ = current_model.transcribe(audio, beam_size=5)
+        text = " ".join([s.text for s in segments])
+        return text
     except Exception as e:
         return f"Transcription Error: {str(e)}"
+# 4. UI (Gradio 6.0 Fixed)
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown("# 🚀 Turbo TikTok Transcriber")
+    gr.Markdown("Paste a TikTok link below. (Agar error aaye to dobara try karein, TikTok kabhi-kabhi block karta hai).")
     with gr.Row():
+        link = gr.Textbox(label="TikTok URL", placeholder="https://www.tiktok.com/@...")
+        btn = gr.Button("Transcribe", variant="primary")
+    out = gr.Textbox(label="Transcript Result", lines=10)
+    btn.click(fn=transcribe, inputs=link, outputs=out)
+demo.launch()