Armando117 commited on
Commit
bbbbf9f
·
1 Parent(s): 24229cb

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +24 -1
app.py CHANGED
@@ -31,13 +31,36 @@ def convert_pdf_to_audio(pdf_file_path):
31
  except Exception as e:
32
  return str(e)
33
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
  # Crear la interfaz de Gradio
35
  iface = gr.Interface(
36
  fn=convert_pdf_to_audio,
37
  inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"), # Tipo de entrada como filepath
38
  outputs=gr.Audio(type="filepath", label="Audio generado"),
39
  title="Conversor de PDF a Audio",
40
- description="Selecciona un archivo PDF y conviértelo a audio en formato MP3.",
41
  )
42
 
43
  # Ejecutar la interfaz
 
31
  except Exception as e:
32
  return str(e)
33
 
34
+
35
+
36
+
37
+
38
+ # Texto descriptivo de las bibliotecas utilizadas
39
+ bibliotecas_desc = """
40
+ Este conversor utiliza las siguientes bibliotecas:
41
+ - **PyPDF2**: para leer archivos PDF y extraer texto.
42
+ - **gTTS (Google Text-to-Speech)**: para convertir el texto extraído en voz.
43
+ - **Gradio**: para crear esta interfaz de usuario interactiva.
44
+ """
45
+
46
+ gtts_desc = """
47
+ **Arquitectura de Aprendizaje Automático de gTTS (Google Text-to-Speech):**
48
+ - `gTTS` es un wrapper de Python que interactúa con el API de Google Text-to-Speech. Este API utiliza modelos avanzados de aprendizaje automático...
49
+ [**Arquitectura de Aprendizaje Automático de gTTS (Google Text-to-Speech):**
50
+ - `gTTS` es un wrapper de Python que interactúa con el API de Google Text-to-Speech. Este API utiliza modelos avanzados de aprendizaje automático desarrollados por Google para convertir texto en voz natural.
51
+ - La tecnología subyacente se basa en redes neuronales de síntesis de voz, específicamente en modelos de síntesis de voz WaveNet desarrollados por DeepMind. Estos modelos utilizan una red neuronal convolucional profunda para generar ondas sonoras directamente a partir de texto.
52
+ - WaveNet es capaz de producir una voz que suena más natural y humana en comparación con los métodos tradicionales de síntesis de voz basados en texto. Esto se logra modelando la secuencia de sonidos de habla y capturando las características únicas de la voz humana.
53
+ - Además, Google continúa mejorando estos modelos con avances en el campo del procesamiento del lenguaje natural y el aprendizaje profundo para ofrecer una variedad de voces y acentos, así como una mejor interpretación del texto a voz.
54
+ ]
55
+ """
56
+
57
  # Crear la interfaz de Gradio
58
  iface = gr.Interface(
59
  fn=convert_pdf_to_audio,
60
  inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"), # Tipo de entrada como filepath
61
  outputs=gr.Audio(type="filepath", label="Audio generado"),
62
  title="Conversor de PDF a Audio",
63
+ description="Selecciona un archivo PDF y conviértelo a audio en formato MP3. {bibliotecas_desc} {gtts_desc}",
64
  )
65
 
66
  # Ejecutar la interfaz