Spaces:
Runtime error
Runtime error
Commit
·
68cf887
1
Parent(s):
c41d932
Update app.py
Browse files
app.py
CHANGED
|
@@ -32,38 +32,13 @@ def convert_pdf_to_audio(pdf_file_path):
|
|
| 32 |
return str(e)
|
| 33 |
|
| 34 |
|
| 35 |
-
|
| 36 |
-
|
| 37 |
-
|
| 38 |
-
# Texto descriptivo de las bibliotecas utilizadas
|
| 39 |
-
|
| 40 |
-
bibliotecas_desc = """
|
| 41 |
-
Este conversor utiliza las siguientes bibliotecas:
|
| 42 |
-
- **PyPDF2**: para leer archivos PDF y extraer texto.
|
| 43 |
-
- **gTTS (Google Text-to-Speech)**: para convertir el texto extraído en voz.
|
| 44 |
-
- **Gradio**: para crear esta interfaz de usuario interactiva.
|
| 45 |
-
"""
|
| 46 |
-
|
| 47 |
-
gtts_desc = """
|
| 48 |
-
[**Arquitectura de Aprendizaje Automático de gTTS (Google Text-to-Speech):**
|
| 49 |
-
- `gTTS` es un wrapper de Python que interactúa con el API de Google Text-to-Speech. Este API utiliza modelos avanzados de aprendizaje automático desarrollados por Google para convertir texto en voz natural.
|
| 50 |
-
- La tecnología subyacente se basa en redes neuronales de síntesis de voz, específicamente en modelos de síntesis de voz WaveNet desarrollados por DeepMind. Estos modelos utilizan una red neuronal convolucional profunda para generar ondas sonoras directamente a partir de texto.
|
| 51 |
-
- WaveNet es capaz de producir una voz que suena más natural y humana en comparación con los métodos tradicionales de síntesis de voz basados en texto. Esto se logra modelando la secuencia de sonidos de habla y capturando las características únicas de la voz humana.
|
| 52 |
-
- Además, Google continúa mejorando estos modelos con avances en el campo del procesamiento del lenguaje natural y el aprendizaje profundo para ofrecer una variedad de voces y acentos, así como una mejor interpretación del texto a voz.
|
| 53 |
-
]
|
| 54 |
-
"""
|
| 55 |
-
|
| 56 |
# Crear la interfaz de Gradio
|
| 57 |
iface = gr.Interface(
|
| 58 |
fn=convert_pdf_to_audio,
|
| 59 |
inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"), # Tipo de entrada como filepath
|
| 60 |
outputs=gr.Audio(type="filepath", label="Audio generado"),
|
| 61 |
title="Conversor de PDF a Audio",
|
| 62 |
-
description="Selecciona un archivo PDF y conviértelo a audio en formato MP3."
|
| 63 |
-
additional_outputs=[
|
| 64 |
-
gr.Markdown(bibliotecas_desc),
|
| 65 |
-
gr.Markdown(gtts_desc)
|
| 66 |
-
]
|
| 67 |
)
|
| 68 |
|
| 69 |
# Ejecutar la interfaz
|
|
|
|
| 32 |
return str(e)
|
| 33 |
|
| 34 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 35 |
# Crear la interfaz de Gradio
|
| 36 |
iface = gr.Interface(
|
| 37 |
fn=convert_pdf_to_audio,
|
| 38 |
inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"), # Tipo de entrada como filepath
|
| 39 |
outputs=gr.Audio(type="filepath", label="Audio generado"),
|
| 40 |
title="Conversor de PDF a Audio",
|
| 41 |
+
description="Selecciona un archivo PDF y conviértelo a audio en formato MP3."
|
|
|
|
|
|
|
|
|
|
|
|
|
| 42 |
)
|
| 43 |
|
| 44 |
# Ejecutar la interfaz
|