Spaces:

ProzisTech
/

translate

Sleeping

Hugo Rodrigues commited on Feb 5, 2024

Commit

b2b9472

1 Parent(s): 6db451f

remove dependency torchaudio

Files changed (1) hide show

main.py CHANGED Viewed

@@ -1,7 +1,6 @@
 import time
 from scipy.io.wavfile import write
-import torchaudio
 import numpy as np
@@ -88,21 +87,19 @@ async def audio(inputs, src_lang="eng", tgt_lang="por", speaker_id=5):
     audio_array_from_text = model.generate(
         **text_inputs, tgt_lang=tgt_lang, speaker_id=int(speaker_id))[0].cpu().numpy().squeeze()
-    print("Time took to process the request and return response is {} sec".format(
-        time.time() - start_time))
-    print(f"sampling_rate {model.config.sampling_rate}")
     write(f"/tmp/output{start_time}.wav", model.config.sampling_rate,
           audio_array_from_text)
     return FileResponse(f"/tmp/output{start_time}.wav", media_type="audio/mpeg")
 @app.post("/transcribe-audio")
 async def transcribe_audio(soundFile: UploadFile, tgt_lang='eng'):
     start_time = time.time()
-    # process input
     inputFile = soundFile.file.read()
     audio_data = np.frombuffer(inputFile, dtype=np.int16)
@@ -116,4 +113,7 @@ async def transcribe_audio(soundFile: UploadFile, tgt_lang='eng'):
     write(f"/tmp/output{start_time}.wav", model.config.sampling_rate,
           audio_array_from_audio)
     return FileResponse(f"/tmp/output{start_time}.wav", media_type="audio/wav")

 import time
 from scipy.io.wavfile import write
 import numpy as np
     audio_array_from_text = model.generate(
         **text_inputs, tgt_lang=tgt_lang, speaker_id=int(speaker_id))[0].cpu().numpy().squeeze()
     write(f"/tmp/output{start_time}.wav", model.config.sampling_rate,
           audio_array_from_text)
+    print("Time took to process the request and return response is {} sec".format(
+        time.time() - start_time))
     return FileResponse(f"/tmp/output{start_time}.wav", media_type="audio/mpeg")
 @app.post("/transcribe-audio")
 async def transcribe_audio(soundFile: UploadFile, tgt_lang='eng'):
     start_time = time.time()
     inputFile = soundFile.file.read()
     audio_data = np.frombuffer(inputFile, dtype=np.int16)
     write(f"/tmp/output{start_time}.wav", model.config.sampling_rate,
           audio_array_from_audio)
+    print("Time took to process the request and return response is {} sec".format(
+        time.time() - start_time))
     return FileResponse(f"/tmp/output{start_time}.wav", media_type="audio/wav")