Spaces:

Rajor78
/

Transcript2Word

Sleeping

Rajor78 commited on Mar 23, 2025

Commit

a6d49c7

verified ·

1 Parent(s): 44473f1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import subprocess
 import os
 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
-from gingerit import GingerIt  # Corregido aquí, solo 'gingerit'
 from docx import Document
 # Función para extraer audio de video
@@ -22,7 +22,7 @@ def transcribe_audio(audio_path):
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
-    inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000)  # Corregido aquí
     # Realizar la transcripción
     result = model.generate(**inputs)
@@ -30,10 +30,12 @@ def transcribe_audio(audio_path):
     return transcription
-# Función para corregir el texto transcrito con Gingerit
 def correct_text(text):
-    parser = GingerIt()
-    corrected_text = parser.parse(text)['result']
     return corrected_text
 # Función principal que procesa el video

 import os
 import librosa
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
+from spellchecker import SpellChecker  # Usaremos pyspellchecker
 from docx import Document
 # Función para extraer audio de video
     audio_input, _ = librosa.load(audio_path, sr=16000)
     # Preprocesar el audio para el modelo
+    inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000)
     # Realizar la transcripción
     result = model.generate(**inputs)
     return transcription
+# Función para corregir el texto transcrito con pyspellchecker
 def correct_text(text):
+    spell = SpellChecker(language='es')  # Usamos español para la corrección
+    words = text.split()  # Separar el texto en palabras
+    corrected_words = [spell.correction(word) for word in words]  # Corregir las palabras
+    corrected_text = " ".join(corrected_words)  # Volver a unir las palabras
     return corrected_text
 # Función principal que procesa el video