Spaces:

dieumercimvemba
/

dm

Running

App Files Files Community

dieumercimvemba commited on Dec 21, 2025

Commit

62027aa

verified ·

1 Parent(s): 89d6539

Update data/generate_subtitles.py

Browse files

Files changed (1) hide show

data/generate_subtitles.py +8 -19

data/generate_subtitles.py CHANGED Viewed

@@ -2,43 +2,32 @@
 import sys
 import stable_whisper
 import json
-import os
 def run():
-    # On attend 3 arguments : l'audio, le SRT de sortie, et le TEXTE ORIGINAL
     if len(sys.argv) < 4:
-        error = {"status": "error", "message": "Usage: python3 generate_subtitles.py <input_audio> <output_srt> <original_text>"}
-        print(json.dumps(error))
         sys.exit(1)
     input_audio = sys.argv[1]
-    output_srt = sys.argv[2]
     original_text = sys.argv[3]
     try:
-        # 1. Chargement de stable-whisper (plus précis pour le timing)
         model = stable_whisper.load_model("base")
-        # 2. Transcription forcée avec le texte original (initial_prompt)
-        # Cela empêche Whisper d'inventer des mots si Tacotron prononce mal
         result = model.transcribe(
             input_audio,
             language="fr",
             initial_prompt=original_text,
-            vad=True # Détecte le silence pour s'arrêter pile quand l'audio finit
         )
-        # 3. Génération du SRT avec balises Karaoké (word_level=True)
-        # C'est ce paramètre qui permet au bleu de défiler mot par mot
-        result.to_srt_vtt(output_srt, word_level=True)
-        # Réponse JSON pour n8n
-        response = {
-            "status": "success",
-            "output_file": output_srt,
-            "text_detected": result.text
-        }
-        print(json.dumps(response))
     except Exception as e:
         print(json.dumps({"status": "error", "message": str(e)}))

 import sys
 import stable_whisper
 import json
 def run():
     if len(sys.argv) < 4:
+        print(json.dumps({"status": "error", "message": "Usage: python3 script.py <audio> <output_ass> <text>"}))
         sys.exit(1)
     input_audio = sys.argv[1]
+    output_ass = sys.argv[2]
     original_text = sys.argv[3]
     try:
         model = stable_whisper.load_model("base")
+        # Alignement avec le texte original
         result = model.transcribe(
             input_audio,
             language="fr",
             initial_prompt=original_text,
+            vad=True
         )
+        # Génération du fichier .ass (format Karaoké pro)
+        # word_level=True crée les balises de timing individuelles
+        result.to_ass(output_ass, word_level=True)
+        print(json.dumps({"status": "success", "output_file": output_ass}))
     except Exception as e:
         print(json.dumps({"status": "error", "message": str(e)}))