Spaces:

Offex
/

Transcripttiktok

Running

App Files Files Community

Offex commited on 4 days ago

Commit

666ec0a

verified ·

1 Parent(s): fec9f07

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -23

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import gradio as gr
 import yt_dlp
 import os
 import shutil
 from faster_whisper import WhisperModel
 # 1. Model Setup
@@ -10,77 +11,90 @@ model = None
 def load_model():
     global model
     if model is None:
-        print("Loading Whisper Model...")
         model = WhisperModel("base", device="cpu", compute_type="int8")
-        print("Model Loaded!")
     return model
-# 2. Audio Download Function (Fixed FFmpeg Issue)
 def get_audio(url):
     try:
         output = "tiktok_audio"
-        # Purani files safai
         if os.path.exists(f"{output}.mp3"): os.remove(f"{output}.mp3")
-        # FFmpeg ka path dhoondo (System me kahan hai)
         ffmpeg_path = shutil.which("ffmpeg") or "/usr/bin/ffmpeg"
         ydl_opts = {
             'format': 'bestaudio/best',
             'outtmpl': output,
-            'ffmpeg_location': ffmpeg_path,  # <--- Fix: FFmpeg ka pakka rasta
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
                 'preferredquality': '192',
             }],
-            'quiet': False, # Logs dikhayega agar error aaye
-            'no_warnings': False,
-            # TikTok Block Bypass Headers
             'http_headers': {
-                'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 14_0 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Mobile/15E148 Safari/604.1',
                 'Referer': 'https://www.tiktok.com/'
             }
         }
         with yt_dlp.YoutubeDL(ydl_opts) as ydl:
-            ydl.download([url])
         return f"{output}.mp3"
     except Exception as e:
-        # Error ko saaf dikhane ke liye
-        return f"Download Error: {str(e)}"
-# 3. Transcription Function
 def transcribe(url):
     if not url: return "⚠️ URL missing!"
     print(f"Processing: {url}")
     audio = get_audio(url)
-    # Agar audio file nahi bani, to error wapas karo
     if not audio.endswith(".mp3"):
-        return f"❌ {audio}"
     try:
         current_model = load_model()
-        segments, _ = current_model.transcribe(audio, beam_size=5)
         text = " ".join([s.text for s in segments])
         return text
     except Exception as e:
         return f"Transcription Error: {str(e)}"
-# 4. UI (Gradio 6.0 Fixed)
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 🚀 Turbo TikTok Transcriber")
-    gr.Markdown("Paste a TikTok link below. (Agar error aaye to dobara try karein, TikTok kabhi-kabhi block karta hai).")
     with gr.Row():
-        link = gr.Textbox(label="TikTok URL", placeholder="https://www.tiktok.com/@...")
         btn = gr.Button("Transcribe", variant="primary")
-    out = gr.Textbox(label="Transcript Result", lines=10)
     btn.click(fn=transcribe, inputs=link, outputs=out)
 demo.launch()

 import yt_dlp
 import os
 import shutil
+import requests
 from faster_whisper import WhisperModel
 # 1. Model Setup
 def load_model():
     global model
     if model is None:
+        print("📥 Loading Whisper Model...")
         model = WhisperModel("base", device="cpu", compute_type="int8")
+        print("✅ Model Loaded!")
     return model
+# 2. Helper: TikTok Short URL to Long URL Resolver
+def get_actual_url(short_url):
+    try:
+        # User-Agent lagana zaroori hai taaki TikTok redirect allow kare
+        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
+        response = requests.head(short_url, allow_redirects=True, headers=headers)
+        print(f"🔗 Converted {short_url} to {response.url}")
+        return response.url
+    except:
+        return short_url
+# 3. Audio Download Function
 def get_audio(url):
     try:
+        # Pehle URL ko resolve karo (Short -> Long)
+        actual_url = get_actual_url(url)
         output = "tiktok_audio"
         if os.path.exists(f"{output}.mp3"): os.remove(f"{output}.mp3")
         ffmpeg_path = shutil.which("ffmpeg") or "/usr/bin/ffmpeg"
         ydl_opts = {
             'format': 'bestaudio/best',
             'outtmpl': output,
+            'ffmpeg_location': ffmpeg_path,
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
                 'preferredquality': '192',
             }],
+            'quiet': False,
+            'no_warnings': True,
+            'nocheckcertificate': True, # SSL Errors ignore karne ke liye
+            'ignoreerrors': False,
+            # TikTok Special Options
+            'extractor_args': {'tiktok': {'app_version': ['30.0.0']}},
             'http_headers': {
+                'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
                 'Referer': 'https://www.tiktok.com/'
             }
         }
         with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+            ydl.download([actual_url])
         return f"{output}.mp3"
     except Exception as e:
+        return f"❌ Download Error: {str(e)}"
+# 4. Transcription Function
 def transcribe(url):
     if not url: return "⚠️ URL missing!"
     print(f"Processing: {url}")
     audio = get_audio(url)
     if not audio.endswith(".mp3"):
+        return audio # Return error message
     try:
         current_model = load_model()
+        # Beam size 1 is faster for CPU
+        segments, _ = current_model.transcribe(audio, beam_size=1)
         text = " ".join([s.text for s in segments])
         return text
     except Exception as e:
         return f"Transcription Error: {str(e)}"
+# 5. UI
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🚀 TikTok Transcriber (Fixed)")
+    gr.Markdown("Agar 'Status Code 0' error aaye, to TikTok ne server IP block kiya hai. Dobara try karein.")
     with gr.Row():
+        link = gr.Textbox(label="TikTok URL", placeholder="Paste https://vt.tiktok.com/... link")
         btn = gr.Button("Transcribe", variant="primary")
+    out = gr.Textbox(label="Result", lines=10)
     btn.click(fn=transcribe, inputs=link, outputs=out)
 demo.launch()