Spaces:

Omnibus
/

Bark-simple

Running

App Files Files Community

Omnibus commited on Aug 30, 2023

Commit

dce80ca

1 Parent(s): 071b368

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -8

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from transformers import AutoProcessor, BarkModel
 import scipy
 from pytube import YouTube
 from pydub import AudioSegment
 #import ffmpeg
@@ -39,6 +39,12 @@ def run_bark(text, n, lang):
     scipy.io.wavfile.write("bark_out.wav", rate=sampling_rate, data=speech_values.cpu().numpy().squeeze())
     return ("bark_out.wav")
 def load_video_yt(vid):
     yt = YouTube(vid)
     vid = yt.streams.filter(progressive=True, file_extension='mp4').order_by('resolution').desc().first().download(filename="tmp.mp4")
@@ -54,10 +60,10 @@ def trim_clip(clip, start_t, end_t):
                                   format="mp4")
     # start and end time
-    start_min = 0
-    start_sec = 10
-    end_min = 0
-    end_sec = 55
     start_min = int(start_t.split(":",1)[0])
     start_sec = int(start_t.split(":",1)[1])
     end_min = int(end_t.split(":",1)[0])
@@ -100,9 +106,8 @@ with gr.Blocks() as app:
                     trim_clip_btn = gr.Button("Trim Clip")
                     trim_aud = gr.Audio(source='upload', interactive = False)
-            yt_vid = gr.Video(type = 'filepath')
-            trim_vid=gr.Video()
             alt_go_btn = gr.Button()
         #speaker_num = gr.Number(value=0)
     with gr.Column():
@@ -111,6 +116,6 @@ with gr.Blocks() as app:
     go_btn.click(run_bark,[in_text, speaker_num, speaker_lang],out_audio)
     load_yt_btn.click(load_video_yt, in_aud_yt, [yt_vid,in_aud_file,aud_file])
     trim_clip_btn.click(trim_clip,[aud_file, start_time, end_time],trim_aud)
-    #alt_go_btn.click()
 app.launch()

 import scipy
 from pytube import YouTube
 from pydub import AudioSegment
+from TTS.api import TTS
 #import ffmpeg
     scipy.io.wavfile.write("bark_out.wav", rate=sampling_rate, data=speech_values.cpu().numpy().squeeze())
     return ("bark_out.wav")
+def custom_bark(inp):
+    speaker_wav=Path("Mid.mp3")
+    tts = TTS(model_name="tts_models/multilingual/multi-dataset/your_tts", progress_bar=False).to(device)
+    tts.tts_to_file("This is voice cloning.", speaker_wav=speaker_wav, language="en", file_path="output.wav")
+    return ("output.wav")
 def load_video_yt(vid):
     yt = YouTube(vid)
     vid = yt.streams.filter(progressive=True, file_extension='mp4').order_by('resolution').desc().first().download(filename="tmp.mp4")
                                   format="mp4")
     # start and end time
+    #start_min = 0
+    #start_sec = 10
+    #end_min = 0
+    #end_sec = 55
     start_min = int(start_t.split(":",1)[0])
     start_sec = int(start_t.split(":",1)[1])
     end_min = int(end_t.split(":",1)[0])
                     trim_clip_btn = gr.Button("Trim Clip")
                     trim_aud = gr.Audio(source='upload', interactive = False)
             alt_go_btn = gr.Button()
+            yt_vid = gr.Video(type = 'filepath')
         #speaker_num = gr.Number(value=0)
     with gr.Column():
     go_btn.click(run_bark,[in_text, speaker_num, speaker_lang],out_audio)
     load_yt_btn.click(load_video_yt, in_aud_yt, [yt_vid,in_aud_file,aud_file])
     trim_clip_btn.click(trim_clip,[aud_file, start_time, end_time],trim_aud)
+    alt_go_btn.click(custom_bark, trim_aud, out_audio)
 app.launch()