Rajor78 commited on
Commit
a6d49c7
verified
1 Parent(s): 44473f1

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +7 -5
app.py CHANGED
@@ -3,7 +3,7 @@ import subprocess
3
  import os
4
  import librosa
5
  from transformers import WhisperProcessor, WhisperForConditionalGeneration
6
- from gingerit import GingerIt # Corregido aqu铆, solo 'gingerit'
7
  from docx import Document
8
 
9
  # Funci贸n para extraer audio de video
@@ -22,7 +22,7 @@ def transcribe_audio(audio_path):
22
  audio_input, _ = librosa.load(audio_path, sr=16000)
23
 
24
  # Preprocesar el audio para el modelo
25
- inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000) # Corregido aqu铆
26
 
27
  # Realizar la transcripci贸n
28
  result = model.generate(**inputs)
@@ -30,10 +30,12 @@ def transcribe_audio(audio_path):
30
 
31
  return transcription
32
 
33
- # Funci贸n para corregir el texto transcrito con Gingerit
34
  def correct_text(text):
35
- parser = GingerIt()
36
- corrected_text = parser.parse(text)['result']
 
 
37
  return corrected_text
38
 
39
  # Funci贸n principal que procesa el video
 
3
  import os
4
  import librosa
5
  from transformers import WhisperProcessor, WhisperForConditionalGeneration
6
+ from spellchecker import SpellChecker # Usaremos pyspellchecker
7
  from docx import Document
8
 
9
  # Funci贸n para extraer audio de video
 
22
  audio_input, _ = librosa.load(audio_path, sr=16000)
23
 
24
  # Preprocesar el audio para el modelo
25
+ inputs = processor(audio_input, return_tensors="pt", sampling_rate=16000)
26
 
27
  # Realizar la transcripci贸n
28
  result = model.generate(**inputs)
 
30
 
31
  return transcription
32
 
33
+ # Funci贸n para corregir el texto transcrito con pyspellchecker
34
  def correct_text(text):
35
+ spell = SpellChecker(language='es') # Usamos espa帽ol para la correcci贸n
36
+ words = text.split() # Separar el texto en palabras
37
+ corrected_words = [spell.correction(word) for word in words] # Corregir las palabras
38
+ corrected_text = " ".join(corrected_words) # Volver a unir las palabras
39
  return corrected_text
40
 
41
  # Funci贸n principal que procesa el video