Spaces:

Peca33
/

Audio-translator

Sleeping

Peca33 commited on Nov 25, 2024

Commit

5926c9d

verified ·

1 Parent(s): c6699ff

traduccion

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,13 +10,13 @@ import tempfile
 # Cargar el modelo Whisper-small y bark
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
-bark = pipeline("text-to-speech", model="suno/bark")
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
-    result = transcribir_audio(audio)
     return result["text"]
@@ -37,7 +37,7 @@ def generar_audio(text):
 def process_audio(audio_file):
     # Paso 1: Transcripción y traducción con Whisper
-    transcripcion_traducida = transcribir(audio_file)["text"]
     # Paso 2: Generación de audio con Bark
     audio_sintetizado = generar_audio(transcripcion_traducida)
@@ -51,11 +51,11 @@ with gr.Blocks() as demo:
     with gr.Row():
         input_audio = gr.Audio(label="Sube tu archivo de audio", type="filepath")
-        transcription_output = gr.Textbox(label="Texto transcrito")
         output_audio = gr.Audio(label="Audio generado")
     process_button = gr.Button("Procesar")
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
-demo.launch()

 # Cargar el modelo Whisper-small y bark
 transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
+"""bark = pipeline("text-to-speech", model="suno/bark")"""
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
+    result = transcribir_audio(audio_file, task="translate")
     return result["text"]
 def process_audio(audio_file):
     # Paso 1: Transcripción y traducción con Whisper
+    transcripcion_traducida = transcribir(audio_file)"""["text"]"""
     # Paso 2: Generación de audio con Bark
     audio_sintetizado = generar_audio(transcripcion_traducida)
     with gr.Row():
         input_audio = gr.Audio(label="Sube tu archivo de audio", type="filepath")
+        transcription_output = gr.Textbox(label="Texto traducido al inglés")
         output_audio = gr.Audio(label="Audio generado")
     process_button = gr.Button("Procesar")
     process_button.click(process_audio, inputs=input_audio, outputs=[transcription_output, output_audio])
 # Lanzar la app
+demo.launch()