Spaces:

Senath
/

iVoiceSeamless

Runtime error

App Files Files Community

Senath commited on Jun 2, 2025

Commit

9a5c6b0

verified ·

1 Parent(s): 39ab70a

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -24

app.py CHANGED Viewed

@@ -18,40 +18,28 @@ def translate(text_input, audio_input, source_lang, target_lang, auto_detect):
     translated_text = None
     translated_audio = None
-    # If text is provided
     if text_input:
         inputs = processor(text=text_input, src_lang=src, return_tensors="pt").to(device)
-        # Generate speech
         speech = model.generate(**inputs, tgt_lang=target_lang)[0].cpu().numpy().squeeze()
-        # Generate text
         text_tokens = model.generate(**inputs, tgt_lang=target_lang, generate_speech=False)
         translated_text = processor.decode(text_tokens[0].tolist()[0], skip_special_tokens=True)
         translated_audio = (16000, speech)
-    # If audio is provided
     elif audio_input:
         waveform, sr = torchaudio.load(audio_input)
         waveform = torchaudio.functional.resample(waveform, sr, 16000)
         inputs = processor(audios=waveform, src_lang=src, return_tensors="pt").to(device)
-        # Generate speech
         speech = model.generate(**inputs, tgt_lang=target_lang)[0].cpu().numpy().squeeze()
-        # Generate text
         text_tokens = model.generate(**inputs, tgt_lang=target_lang, generate_speech=False)
         translated_text = processor.decode(text_tokens[0].tolist()[0], skip_special_tokens=True)
         translated_audio = (16000, speech)
     if translated_text or translated_audio:
         return translated_text or "", translated_audio
     return "No input provided.", None
-# Gradio Interface
-iface = gr.Interface(
     fn=translate,
     inputs=[
         gr.Textbox(label="Input Text (optional)"),
@@ -65,13 +53,8 @@ iface = gr.Interface(
         gr.Audio(label="Translated Speech")
     ],
     title="iVoice Translate (Text + Speech)"
-).queue()
-# Launch server with API exposed
-if __name__ == "__main__":
-    iface.launch(
-        server_name="0.0.0.0",
-        server_port=int(os.environ.get("PORT", 7860)),
-        share=True,
-        show_api=True  # 🔥 This exposes /gradio_api/predict endpoint
-    )

     translated_text = None
     translated_audio = None
     if text_input:
         inputs = processor(text=text_input, src_lang=src, return_tensors="pt").to(device)
         speech = model.generate(**inputs, tgt_lang=target_lang)[0].cpu().numpy().squeeze()
         text_tokens = model.generate(**inputs, tgt_lang=target_lang, generate_speech=False)
         translated_text = processor.decode(text_tokens[0].tolist()[0], skip_special_tokens=True)
         translated_audio = (16000, speech)
     elif audio_input:
         waveform, sr = torchaudio.load(audio_input)
         waveform = torchaudio.functional.resample(waveform, sr, 16000)
         inputs = processor(audios=waveform, src_lang=src, return_tensors="pt").to(device)
         speech = model.generate(**inputs, tgt_lang=target_lang)[0].cpu().numpy().squeeze()
         text_tokens = model.generate(**inputs, tgt_lang=target_lang, generate_speech=False)
         translated_text = processor.decode(text_tokens[0].tolist()[0], skip_special_tokens=True)
         translated_audio = (16000, speech)
     if translated_text or translated_audio:
         return translated_text or "", translated_audio
     return "No input provided.", None
+# ✅ This exposes the endpoint correctly
+gr.Interface(
     fn=translate,
     inputs=[
         gr.Textbox(label="Input Text (optional)"),
         gr.Audio(label="Translated Speech")
     ],
     title="iVoice Translate (Text + Speech)"
+).launch(
+    server_name="0.0.0.0",
+    server_port=int(os.environ.get("PORT", 7860)),
+    show_api=True
+)