Spaces:

Rajor78
/

Transcript2Word

Sleeping

App Files Files Community

Rajor78 commited on Mar 23, 2025

Commit

88bf030

verified ·

1 Parent(s): 97e782a

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -48

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import subprocess
 import os
 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
-import language_tool_python
 from pydub import AudioSegment
 from docx import Document
@@ -23,50 +23,4 @@ def transcribe_audio(audio_path):
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
-    inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000)
-    # Realizar la transcripción
-    result = model.generate(**inputs)
-    transcription = processor.decode(result[0], skip_special_tokens=True)
-    return transcription
-# Función para corregir el texto transcrito con LanguageTool
-def correct_text(text):
-    tool = language_tool_python.LanguageTool('es')
-    matches = tool.check(text)
-    return language_tool_python.utils.correct(text, matches)
-# Función principal que procesa el video
-def process_video(video_file):
-    video_path = video_file.name
-    audio_path = os.path.splitext(video_path)[0] + '.wav'
-    # Extraer el audio del video
-    extract_audio(video_path, audio_path)
-    # Transcribir el audio
-    transcribed_text = transcribe_audio(audio_path)
-    # Corregir la transcripción
-    corrected_text = correct_text(transcribed_text)
-    # Crear un documento Word con la transcripción corregida
-    doc = Document()
-    doc.add_paragraph(corrected_text)
-    doc_path = "transcription.docx"
-    doc.save(doc_path)
-    return corrected_text, doc_path
-# Interfaz de Gradio
-demo = gr.Interface(
-    fn=process_video,
-    inputs=gr.File(label="Sube un archivo de video"),
-    outputs=[
-        gr.Textbox(label="Texto transcrito y corregido"),
-        gr.File(label="Descargar transcripción Word")
-    ]
-)
-demo.launch()

 import os
 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
+from gingerit.gingerit import GingerIt
 from pydub import AudioSegment
 from docx import Document
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
+    inputs =