Spaces:

Pushkar0655g
/

multilingual-subtitle-tool

Sleeping

App Files Files Community

Pushkar0655g commited on Mar 19, 2025

Commit

fc7755f

1 Parent(s): beae951

Fix file handling and FFmpeg conversion

Browse files

Files changed (2) hide show

app.py +71 -19
utils.py +9 -6

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-from utils import process_video
 # Define supported languages
 language_map = {
@@ -16,33 +16,85 @@ language_map = {
     "Japanese": "Helsinki-NLP/opus-mt-en-jap"
 }
-def generate_subtitles(video_file, language):
-    try:
-        srt_path = process_video(video_file, language)
-        return srt_path
-    except Exception as e:
-        return f"Error: {str(e)}"
 # Define Gradio Interface
-with gr.Blocks() as demo:
-    gr.Markdown("# AI-Powered Video Subtitling")
-    gr.Markdown("Upload a video and select a language to generate subtitles.")
     with gr.Row():
-        video_input = gr.Video(label="Upload Video File", format="mp4")  # Use gr.Video instead of gr.File
-        language_dropdown = gr.Dropdown(
-            choices=list(language_map.keys()),
-            label="Select Subtitle Language",
-            value="English"
-        )
-    generate_button = gr.Button("Generate Subtitles")
     output_srt = gr.File(label="Download Subtitles")
     generate_button.click(
         generate_subtitles,
         inputs=[video_input, language_dropdown],
-        outputs=output_srt
     )
 demo.launch()

 import gradio as gr
+from utils import process_video  # Ensure this points to the updated utils.py
 # Define supported languages
 language_map = {
     "Japanese": "Helsinki-NLP/opus-mt-en-jap"
 }
+# Custom CSS for dark mode and animations
+css = """
+body {
+    background-color: #1a1a1a;
+    color: #e0e0e0;
+    font-family: 'Arial', sans-serif;
+}
+.gradio-container {
+    max-width: 1200px;
+    margin: 0 auto;
+    padding: 20px;
+    border-radius: 10px;
+    box-shadow: 0 4px 6px rgba(0, 0, 0, 0.1);
+}
+.file-preview {
+    border: 2px dashed #6c757d;
+    padding: 20px;
+    border-radius: 10px;
+}
+.progress-text {
+    font-size: 16px;
+    color: #28a745;
+    animation: blink 1s infinite;
+}
+@keyframes blink {
+    50% { opacity: 0.5; }
+}
+"""
 # Define Gradio Interface
+with gr.Blocks(theme=gr.themes.Monochrome(), css=css) as demo:
+    gr.Markdown("# 🎥 AI-Powered Video Subtitling")
+    gr.Markdown("Upload a video (MP4/MKV/AVI) and select a language to generate subtitles.")
     with gr.Row():
+        with gr.Column(scale=2):
+            video_input = gr.File(
+                label="Upload Video File",
+                file_types=["mp4", "mkv", "avi"],
+                elem_classes=["file-preview"]
+            )
+        with gr.Column(scale=1):
+            language_dropdown = gr.Dropdown(
+                choices=list(language_map.keys()),
+                label="Select Subtitle Language",
+                value="English"
+            )
+    generate_button = gr.Button("Generate Subtitles 🚀")
+    progress_text = gr.Textbox(
+        label="Progress",
+        interactive=False,
+        elem_classes=["progress-text"]
+    )
     output_srt = gr.File(label="Download Subtitles")
+    def generate_subtitles(video_file, language):
+        try:
+            # Validate file type
+            if not video_file.name.lower().endswith(('.mp4', '.mkv', '.avi')):
+                return None, "❌ Invalid file type. Please upload an MP4, MKV, or AVI file."
+            # Update progress
+            progress = "🔄 Processing video..."
+            yield None, progress  # Initial progress update
+            # Process video
+            srt_path = process_video(video_file.name, language)
+            if srt_path:
+                yield gr.File(srt_path), "✅ Subtitles generated successfully!"
+            else:
+                yield None, "❌ Error during processing. Check logs."
+        except Exception as e:
+            yield None, f"❌ Error: {str(e)}"
     generate_button.click(
         generate_subtitles,
         inputs=[video_input, language_dropdown],
+        outputs=[output_srt, progress_text]
     )
 demo.launch()

utils.py CHANGED Viewed

@@ -7,16 +7,18 @@ import subprocess
 # Load Whisper model
 model = whisper.load_model("base")
-def process_video(video_path, language):  # Accept file path, not file object
-    output_video_path = os.path.join(tempfile.gettempdir(), "converted_video.mp4")
-    srt_path = os.path.join(tempfile.gettempdir(), "subtitles.srt")
     try:
         # Convert video to MP4 using ffmpeg
-        print("Converting video to MP4...")
         subprocess.run(
             ["ffmpeg", "-i", video_path, "-c:v", "libx264", "-preset", "fast", output_video_path],
-            check=True,  # Raise error if ffmpeg fails
             stdout=subprocess.PIPE,
             stderr=subprocess.PIPE
         )
@@ -48,6 +50,7 @@ def process_video(video_path, language):  # Accept file path, not file object
             if not model_name:
                 return f"Unsupported language: {language}"
             print(f"Loading translation model: {model_name}")
             if language == "Telugu":
                 tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -76,7 +79,7 @@ def process_video(video_path, language):  # Accept file path, not file object
                 end = f"{segment['end']:.3f}".replace(".", ",")
                 text = segment["text"].strip()
                 f.write(f"{i}\n00:00:{start} --> 00:00:{end}\n{text}\n\n")
-        print("SRT file created successfully!")
         return srt_path
     except subprocess.CalledProcessError as e:

 # Load Whisper model
 model = whisper.load_model("base")
+def process_video(video_path, language):
+    # Create a temporary directory
+    temp_dir = tempfile.gettempdir()
+    output_video_path = os.path.join(temp_dir, "converted_video.mp4")
+    srt_path = os.path.join(temp_dir, "subtitles.srt")
     try:
         # Convert video to MP4 using ffmpeg
+        print(f"Converting video: {video_path} to MP4...")
         subprocess.run(
             ["ffmpeg", "-i", video_path, "-c:v", "libx264", "-preset", "fast", output_video_path],
+            check=True,
             stdout=subprocess.PIPE,
             stderr=subprocess.PIPE
         )
             if not model_name:
                 return f"Unsupported language: {language}"
+            # Load translation model
             print(f"Loading translation model: {model_name}")
             if language == "Telugu":
                 tokenizer = AutoTokenizer.from_pretrained(model_name)
                 end = f"{segment['end']:.3f}".replace(".", ",")
                 text = segment["text"].strip()
                 f.write(f"{i}\n00:00:{start} --> 00:00:{end}\n{text}\n\n")
+        print(f"SRT file saved to {srt_path}")
         return srt_path
     except subprocess.CalledProcessError as e: