video-ffmpeg

Sleeping

App Files Files Community

Tim13ekd commited on Dec 14, 2025

Commit

98780cd

verified ·

1 Parent(s): 7ad20cd

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -17

app.py CHANGED Viewed

@@ -4,7 +4,6 @@ from pathlib import Path
 import uuid
 import subprocess
 import shutil
-import io  # Für NamedString-Handling
 import shlex  # Für sicheres Escapen von Text
 # Erlaubte Dateiformate
@@ -13,7 +12,7 @@ allowed_audios = [".mp3", ".wav", ".m4a", ".ogg"]
 def save_temp_audio(audio_file):
     """
-    Speichert die hochgeladene Datei sicher mit korrekter Endung in einem temporären Verzeichnis.
     """
     if isinstance(audio_file, str):
         ext = Path(audio_file).suffix
@@ -35,16 +34,7 @@ def save_temp_audio(audio_file):
     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
-def convert_audio_to_wav(audio_path):
-    """
-    Konvertiert das Audio in das WAV-Format, um sicherzustellen, dass FFmpeg es korrekt verarbeitet.
-    """
-    wav_path = Path(audio_path).with_suffix(".wav")
-    cmd = ["ffmpeg", "-y", "-i", str(audio_path), str(wav_path)]
-    subprocess.run(cmd, check=True, capture_output=True, text=True)
-    return wav_path
-def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_pos=0.5, fade_duration=0.7, font_size=60, speed=1.0, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
@@ -56,12 +46,10 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_p
     words = input_text.split()
     total_words = len(words)
-    # Wenn Audio vorhanden ist, die Dauer an die Länge des Audios anpassen (optional)
     temp_audio_file = None
     if audio_file:
         temp_audio_file = save_temp_audio(audio_file)
-        # Konvertiere das Audio in WAV, falls es MP3 oder ein anderes Format ist
-        temp_audio_file = convert_audio_to_wav(temp_audio_file)
     # Einzelne Clips für jedes Wort erstellen
     for i, word in enumerate(words):
@@ -75,6 +63,7 @@ def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_p
         )
         if text:
             safe_text = shlex.quote(text)
             drawtext_filter = (
                 f",drawtext=text={safe_text}:fontcolor=white:fontsize={font_size}:borderw=2:"
@@ -156,7 +145,6 @@ with gr.Blocks() as demo:
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
     ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0.5=mitte, 0.9=unten)")
     font_size_input = gr.Number(value=60, label="Textgröße (px)")
-    speed_input = gr.Slider(minimum=0.1, maximum=3.0, value=1.0, label="Geschwindigkeit der Texteinblendung")
     audio_input = gr.File(
         label="Audio hinzufügen (optional)",
@@ -169,7 +157,7 @@ with gr.Blocks() as demo:
     btn = gr.Button("Video erstellen")
     btn.click(
         fn=generate_slideshow_with_audio,
-        inputs=[img_input, text_input, duration_input, ypos_input, fade_input, font_size_input, speed_input, audio_input],
         outputs=[out_video, status]
     )

 import uuid
 import subprocess
 import shutil
 import shlex  # Für sicheres Escapen von Text
 # Erlaubte Dateiformate
 def save_temp_audio(audio_file):
     """
+    Speichert die hochgeladene Datei sicher in einem temporären Verzeichnis.
     """
     if isinstance(audio_file, str):
         ext = Path(audio_file).suffix
     else:
         raise ValueError("Das übergebene Audio ist kein gültiges Dateiformat oder NamedString.")
+def generate_slideshow_with_audio(images, input_text, duration_per_word=0.5, y_pos=0.5, fade_duration=0.7, font_size=60, audio_file=None):
     if not images:
         return None, "❌ Keine Bilder ausgewählt"
     words = input_text.split()
     total_words = len(words)
+    # Falls Audio vorhanden ist, speichern wir es einfach als temporäre Datei
     temp_audio_file = None
     if audio_file:
         temp_audio_file = save_temp_audio(audio_file)
     # Einzelne Clips für jedes Wort erstellen
     for i, word in enumerate(words):
         )
         if text:
+            # Sichere Textverarbeitung (Escape von Sonderzeichen)
             safe_text = shlex.quote(text)
             drawtext_filter = (
                 f",drawtext=text={safe_text}:fontcolor=white:fontsize={font_size}:borderw=2:"
     fade_input = gr.Number(value=0.7, label="Fade Dauer in Sekunden", precision=1)
     ypos_input = gr.Slider(minimum=0.0, maximum=0.9, step=0.01, value=0.5, label="Y-Position für alle Texte (0=oben, 0.5=mitte, 0.9=unten)")
     font_size_input = gr.Number(value=60, label="Textgröße (px)")
     audio_input = gr.File(
         label="Audio hinzufügen (optional)",
     btn = gr.Button("Video erstellen")
     btn.click(
         fn=generate_slideshow_with_audio,
+        inputs=[img_input, text_input, duration_input, ypos_input, fade_input, font_size_input, audio_input],
         outputs=[out_video, status]
     )