Cutter

Sleeping

App Files Files Community

salomonsky commited on Nov 23, 2023

Commit

0b137ef

1 Parent(s): 1b332f4

Update dub.py

Browse files

Files changed (1) hide show

dub.py +26 -20

dub.py CHANGED Viewed

@@ -7,38 +7,44 @@ import speech_recognition as sr
 def text_to_speech(text, lang='es'):
     tts = gTTS(text=text, lang=lang, slow=False)
-    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
-    tts.save(temp_file.name)
-    return temp_file.name
 def transcribe_and_dub(video_file):
     temp_folder = tempfile.mkdtemp()
     recognizer = sr.Recognizer()
-    with mp.VideoFileClip(video_file) as video:
-        audio_file = os.path.join(temp_folder, "audio.wav")
-        video.audio.write_audiofile(audio_file)
         process = os.popen(f'ffmpeg -i "{audio_file}" -ar 16000 -ac 1 "{os.path.join(temp_folder, "audio16000.wav")}"')
         process.close()
         audio_file = os.path.join(temp_folder, "audio16000.wav")
         with sr.AudioFile(audio_file) as source:
             audio = recognizer.record(source)
-    text = recognizer.recognize_google(audio, language='es')
-    dubbed_audio_file = text_to_speech(text)
-    dubbed_video_file = os.path.join(temp_folder, "dubbed_video.mp4")
-    with mp.VideoFileClip(video_file) as original_video:
         dubbed_audio = AudioSegment.from_mp3(dubbed_audio_file)
-        dubbed_audio = dubbed_audio[:len(original_video.audio)]
-        dubbed_audio.export(os.path.join(temp_folder, "dubbed_audio.wav"), format="wav")
-        process = os.popen(f'ffmpeg -i "{video_file}" -i "{os.path.join(temp_folder, "dubbed_audio.wav")}" -c:v copy -c:a aac -strict experimental -map 0:v:0 -map 1:a:0 "{dubbed_video_file}"')
-        process.close()
-    return dubbed_video_file

 def text_to_speech(text, lang='es'):
     tts = gTTS(text=text, lang=lang, slow=False)
+    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_file:
+        tts.save(temp_file.name)
+        return temp_file.name
 def transcribe_and_dub(video_file):
     temp_folder = tempfile.mkdtemp()
     recognizer = sr.Recognizer()
+    try:
+        with mp.VideoFileClip(video_file) as video:
+            audio_file = os.path.join(temp_folder, "audio.wav")
+            video.audio.write_audiofile(audio_file)
         process = os.popen(f'ffmpeg -i "{audio_file}" -ar 16000 -ac 1 "{os.path.join(temp_folder, "audio16000.wav")}"')
         process.close()
         audio_file = os.path.join(temp_folder, "audio16000.wav")
         with sr.AudioFile(audio_file) as source:
             audio = recognizer.record(source)
+        text = recognizer.recognize_google(audio, language='es')
+        dubbed_audio_file = text_to_speech(text)
+        original_audio = AudioSegment.from_file(audio_file, format="wav")
         dubbed_audio = AudioSegment.from_mp3(dubbed_audio_file)
+        final_audio = original_audio.overlay(dubbed_audio)
+        video_with_dubbed_audio = mp.VideoFileClip(video_file).set_audio(final_audio)
+        dubbed_video_file = os.path.join(temp_folder, "dubbed_video.mp4")
+        video_with_dubbed_audio.write_videofile(dubbed_video_file, codec="libx264", audio_codec="aac", verbose=False)
+        return dubbed_video_file
+    except Exception as e:
+        print(f"Error during transcription and dubbing: {str(e)}")
+        return None