Spaces:

Offex
/

Transcripttiktok

Running

App Files Files Community

Offex commited on 5 days ago

Commit

d97d093

verified ·

1 Parent(s): 917b80c

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -41

app.py CHANGED Viewed

@@ -1,29 +1,34 @@
 import gradio as gr
 import yt_dlp
-import whisper
 import os
-# 1. Load Whisper Model (Small model CPU par fast chalta hai)
-# Agar GPU available hai, to ye automatically use karega, warna CPU.
-print("Loading Whisper Model...")
-model = whisper.load_model("base")
-print("Model Loaded!")
-def get_audio_from_tiktok(url):
     """
-    TikTok URL se audio download karne ka function using yt-dlp
     """
     try:
-        # Output filename template
-        output_filename = "downloaded_audio"
-        # Agar purani file hai to delete karein
         if os.path.exists(f"{output_filename}.mp3"):
             os.remove(f"{output_filename}.mp3")
         ydl_opts = {
             'format': 'bestaudio/best',
-            'outtmpl': output_filename,  # File name without extension
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
@@ -38,51 +43,48 @@ def get_audio_from_tiktok(url):
             ydl.download([url])
         return f"{output_filename}.mp3"
     except Exception as e:
-        return str(e)
 def process_tiktok(tiktok_url):
-    """
-    Main function jo UI se connect hoga
-    """
     if not tiktok_url:
-        return "Error: Please enter a valid URL."
-    # Step 1: Download Audio
-    print(f"Downloading from: {tiktok_url}")
     audio_path = get_audio_from_tiktok(tiktok_url)
-    # Check if download was successful (audio path should be a file path, not error text)
     if not audio_path.endswith(".mp3"):
-        return f"Download Failed: {audio_path}"
-    # Step 2: Transcribe using Whisper
-    print("Transcribing...")
     try:
-        # Whisper audio ko text me badal dega
-        result = model.transcribe(audio_path)
-        transcript = result["text"]
-        return transcript
     except Exception as e:
         return f"Transcription Error: {str(e)}"
-# --- Gradio UI ---
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
-    gr.Markdown(
-        """
-        # 🎵 TikTok to Text Transcriber
-        Paste a TikTok link below to get the text transcript of the video.
-        """
-    )
     with gr.Row():
-        inp_url = gr.Textbox(label="TikTok Video URL", placeholder="Paste link here (e.g., https://www.tiktok.com/@user/video/...)")
-        btn = gr.Button("Transcribe 📝", variant="primary")
-    out_text = gr.Textbox(label="Transcript", lines=10, show_copy_button=True)
-    btn.click(fn=process_tiktok, inputs=inp_url, outputs=out_text)
-# Launch
 demo.launch()

 import gradio as gr
 import yt_dlp
 import os
+from faster_whisper import WhisperModel
+# Global variable to store the model
+model = None
+def load_model_if_needed():
     """
+    Model ko tabhi load karega jab zaroorat hogi (Lazy Loading).
+    Isse App turant start ho jayegi.
     """
+    global model
+    if model is None:
+        print("📥 Loading Whisper Model for the first time... (Please wait)")
+        # 'tiny' fast hai, 'base' thoda better hai.
+        model = WhisperModel("base", device="cpu", compute_type="int8")
+        print("✅ Model Loaded!")
+    return model
+def get_audio_from_tiktok(url):
     try:
+        output_filename = "tiktok_audio"
+        # Purani file delete karein
         if os.path.exists(f"{output_filename}.mp3"):
             os.remove(f"{output_filename}.mp3")
         ydl_opts = {
             'format': 'bestaudio/best',
+            'outtmpl': output_filename,
             'postprocessors': [{
                 'key': 'FFmpegExtractAudio',
                 'preferredcodec': 'mp3',
             ydl.download([url])
         return f"{output_filename}.mp3"
     except Exception as e:
+        return f"Error: {str(e)}"
 def process_tiktok(tiktok_url):
     if not tiktok_url:
+        return "⚠️ Please enter a URL."
+    # 1. Load Model (Sirf pehli baar time lega)
+    try:
+        current_model = load_model_if_needed()
+    except Exception as e:
+        return f"Model Loading Error: {str(e)}"
+    # 2. Download Audio
+    print(f"⬇️ Downloading audio from: {tiktok_url}")
     audio_path = get_audio_from_tiktok(tiktok_url)
     if not audio_path.endswith(".mp3"):
+        return f"Download Error: {audio_path}"
+    # 3. Transcribe
+    print("📝 Transcribing...")
     try:
+        segments, info = current_model.transcribe(audio_path, beam_size=5)
+        full_text = ""
+        for segment in segments:
+            full_text += segment.text + " "
+        return full_text.strip()
     except Exception as e:
         return f"Transcription Error: {str(e)}"
+# --- UI ---
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🚀 Turbo TikTok Transcriber")
+    gr.Markdown("Note: Pehli baar run karne par 1-2 minute lagenge (Model download hoga). Uske baad ye fast chalega.")
     with gr.Row():
+        url_input = gr.Textbox(label="TikTok URL", placeholder="Paste link here...")
+        run_btn = gr.Button("Transcribe", variant="primary")
+    output_text = gr.Textbox(label="Transcript", lines=10, show_copy_button=True)
+    run_btn.click(fn=process_tiktok, inputs=url_input, outputs=output_text)
 demo.launch()