Spaces:

Rajor78
/

Transcript2Word

Sleeping

App Files Files Community

Rajor78 commited on Mar 23, 2025

Commit

120d1ea

verified ·

1 Parent(s): b58c622

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -2

app.py CHANGED Viewed

@@ -4,7 +4,6 @@ import os
 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 from gingerit.gingerit import GingerIt
-from pydub import AudioSegment
 from docx import Document
 # Función para extraer audio de video
@@ -23,4 +22,50 @@ def transcribe_audio(audio_path):
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
-    inputs =

 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 from gingerit.gingerit import GingerIt
 from docx import Document
 # Función para extraer audio de video
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
+    inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000)  # Corregir aquí
+    # Realizar la transcripción
+    result = model.generate(**inputs)
+    transcription = processor.decode(result[0], skip_special_tokens=True)
+    return transcription
+# Función para corregir el texto transcrito con Gingerit
+def correct_text(text):
+    parser = GingerIt()
+    corrected_text = parser.parse(text)['result']
+    return corrected_text
+# Función principal que procesa el video
+def process_video(video_file):
+    video_path = video_file.name
+    audio_path = os.path.splitext(video_path)[0] + '.wav'
+    # Extraer el audio del video
+    extract_audio(video_path, audio_path)
+    # Transcribir el audio
+    transcribed_text = transcribe_audio(audio_path)
+    # Corregir la transcripción
+    corrected_text = correct_text(transcribed_text)
+    # Crear un documento Word con la transcripción corregida
+    doc = Document()
+    doc.add_paragraph(corrected_text)
+    doc_path = "transcription.docx"
+    doc.save(doc_path)
+    return corrected_text, doc_path
+# Interfaz de Gradio
+demo = gr.Interface(
+    fn=process_video,
+    inputs=gr.File(label="Sube un archivo de video"),
+    outputs=[
+        gr.Textbox(label="Texto transcrito y corregido"),
+        gr.File(label="Descargar transcripción Word")
+    ]
+)
+demo.launch()