Spaces:

Peca33
/

Audio-translator

Sleeping

Peca33 commited on Nov 25, 2024

Commit

f00a82c

verified ·

1 Parent(s): ee71922

gggg

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,24 +10,26 @@ from transformers import MarianMTModel, MarianTokenizer
 # Cargar el modelo Whisper-small y bark
-transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
 """bark = pipeline("text-to-speech", model="suno/bark")"""
 # Cargar el tokenizador y el modelo para español a inglés
-model_name = "Helsinki-NLP/opus-mt-es-en"
-tokenizer = MarianTokenizer.from_pretrained(model_name)
-model = MarianMTModel.from_pretrained(model_name)
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
-    result = transcribir_audio(audio_file, task="translate")
     return result["text"]
 def traducir_texto(texto):
     # Tokenizar el texto
     inputs = tokenizer(texto, return_tensors="pt", padding=True, truncation=True)
     # Generar la traducción
@@ -46,9 +48,20 @@ def generar_audio(text):
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
     write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))
     return temp_wav.name
 def process_audio(audio_file):
     try:
         # Paso 1: Transcripción con Whisper

 # Cargar el modelo Whisper-small y bark
 """bark = pipeline("text-to-speech", model="suno/bark")"""
 # Cargar el tokenizador y el modelo para español a inglés
 # Función para transcribir el audio y traducir el audio de entrada
 def transcribir_audio(audio):
     # Usamos el pipeline de Hugging Face para la transcripción
+    transcribir = pipeline("automatic-speech-recognition", model="openai/whisper-small")
+    result = transcribir(audio)
     return result["text"]
 def traducir_texto(texto):
+    model_name = "Helsinki-NLP/opus-mt-es-en"
+    tokenizer = MarianTokenizer.from_pretrained(model_name)
+    model = MarianMTModel.from_pretrained(model_name)
     # Tokenizar el texto
     inputs = tokenizer(texto, return_tensors="pt", padding=True, truncation=True)
     # Generar la traducción
     temp_wav = tempfile.NamedTemporaryFile(delete=False, suffix=".wav")
     write(temp_wav.name, 24000, (audio_array * 32767).astype(np.int16))
     return temp_wav.name
+"""def process_audio(audio_file):
+    try:
+        # Paso 1: Transcripción y traducción con Whisper
+        transcripcion_traducida = transcribir_audio(audio_file)
+        # Paso 2: Generación de audio con Bark
+        audio_sintetizado = generar_audio(transcripcion_traducida)
+        return transcripcion_traducida, audio_sintetizado
+    except Exception as e:
+        return str(e), None"""
 def process_audio(audio_file):
     try:
         # Paso 1: Transcripción con Whisper