video-ffmpeg

Sleeping

App Files Files Community

Tim13ekd commited on Dec 14, 2025

Commit

2f3dcbb

verified ·

1 Parent(s): 98780cd

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -10

app.py CHANGED Viewed

@@ -34,7 +34,7 @@ def save_temp_audio(audio_file):
     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
-def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_pos=0.5, fade_duration=0.7, font_size=60, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
@@ -51,9 +51,13 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_p
     if audio_file:
         temp_audio_file = save_temp_audio(audio_file)
-    # Einzelne Clips für jedes Wort erstellen
-    for i, word in enumerate(words):
         clip_path = Path(temp_dir) / f"clip_{i}.mp4"
         text = word
         vf_filters = (
@@ -75,16 +79,16 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_p
         cmd = [
             "ffmpeg",
             "-y",
-            "-f", "lavfi",
-            "-t", str(duration_per_word),
-            "-i", "color=c=black:s=1280x720",
             "-vf", vf_filters,
             str(clip_path)
         ]
         try:
             subprocess.run(cmd, check=True, capture_output=True, text=True)
         except subprocess.CalledProcessError as e:
-            return None, f"❌ FFmpeg Fehler bei Wort {i+1}:\n{e.stderr}"
         clips.append(clip_path)
@@ -141,7 +145,8 @@ with gr.Blocks() as demo:
         placeholder="Gib hier den Text ein, der Wort für Wort eingeblendet werden soll",
         lines=5
     )
-    duration_input = gr.Number(value=0.5, label="Dauer pro Wort in Sekunden", precision=1)
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
     ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0.5=mitte, 0.9=unten)")
     font_size_input = gr.Number(value=60, label="Textgröße (px)")
@@ -157,8 +162,8 @@ with gr.Blocks() as demo:
     btn = gr.Button("Video erstellen")
     btn.click(
         fn=generate_slideshow_with_audio,
-        inputs=[img_input, text_input, duration_input, ypos_input, fade_input, font_size_input, audio_input],
         outputs=[out_video, status]
     )
-demo.launch()

     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
+def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, duration_per_image=3, y_pos=0.5, fade_duration=0.7, font_size=60, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
     if audio_file:
         temp_audio_file = save_temp_audio(audio_file)
+    # Clips für jedes Bild erstellen
+    for i, img_path in enumerate(images):
+        img_path = Path(img_path.name)  # Sicherstellen, dass es den richtigen Pfad hat
         clip_path = Path(temp_dir) / f"clip_{i}.mp4"
+        # Berechnen der Dauer für das aktuelle Wort
+        word = words[i % total_words]  # Wenn weniger Wörter als Bilder, wiederholen wir den Text
         text = word
         vf_filters = (
         cmd = [
             "ffmpeg",
             "-y",
+            "-loop", "1",
+            "-i", str(img_path),
+            "-t", str(duration_per_image),
             "-vf", vf_filters,
             str(clip_path)
         ]
         try:
             subprocess.run(cmd, check=True, capture_output=True, text=True)
         except subprocess.CalledProcessError as e:
+            return None, f"❌ FFmpeg Fehler bei Bild {i+1}:\n{e.stderr}"
         clips.append(clip_path)
         placeholder="Gib hier den Text ein, der Wort für Wort eingeblendet werden soll",
         lines=5
     )
+    duration_word_input = gr.Number(value=0.5, label="Dauer pro Wort in Sekunden", precision=1)
+    duration_image_input = gr.Number(value=3, label="Dauer pro Bild in Sekunden", precision=1)
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
     ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0.5=mitte, 0.9=unten)")
     font_size_input = gr.Number(value=60, label="Textgröße (px)")
     btn = gr.Button("Video erstellen")
     btn.click(
         fn=generate_slideshow_with_audio,
+        inputs=[img_input, text_input, duration_word_input, duration_image_input, ypos_input, fade_input, font_size_input, audio_input],
         outputs=[out_video, status]
     )
+demo.launch()