Spaces:

Armando117
/

pdfreaderwithgTTTS

Runtime error

App Files Files Community

Armando117 commited on Dec 11, 2023

Commit

bbbbf9f

1 Parent(s): 24229cb

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -1

app.py CHANGED Viewed

@@ -31,13 +31,36 @@ def convert_pdf_to_audio(pdf_file_path):
     except Exception as e:
         return str(e)
 # Crear la interfaz de Gradio
 iface = gr.Interface(
     fn=convert_pdf_to_audio,
     inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"),  # Tipo de entrada como filepath
     outputs=gr.Audio(type="filepath", label="Audio generado"),
     title="Conversor de PDF a Audio",
-    description="Selecciona un archivo PDF y conviértelo a audio en formato MP3.",
 )
 # Ejecutar la interfaz

     except Exception as e:
         return str(e)
+# Texto descriptivo de las bibliotecas utilizadas
+bibliotecas_desc = """
+Este conversor utiliza las siguientes bibliotecas:
+- **PyPDF2**: para leer archivos PDF y extraer texto.
+- **gTTS (Google Text-to-Speech)**: para convertir el texto extraído en voz.
+- **Gradio**: para crear esta interfaz de usuario interactiva.
+"""
+gtts_desc = """
+**Arquitectura de Aprendizaje Automático de gTTS (Google Text-to-Speech):**
+- `gTTS` es un wrapper de Python que interactúa con el API de Google Text-to-Speech. Este API utiliza modelos avanzados de aprendizaje automático...
+[**Arquitectura de Aprendizaje Automático de gTTS (Google Text-to-Speech):**
+- `gTTS` es un wrapper de Python que interactúa con el API de Google Text-to-Speech. Este API utiliza modelos avanzados de aprendizaje automático desarrollados por Google para convertir texto en voz natural.
+- La tecnología subyacente se basa en redes neuronales de síntesis de voz, específicamente en modelos de síntesis de voz WaveNet desarrollados por DeepMind. Estos modelos utilizan una red neuronal convolucional profunda para generar ondas sonoras directamente a partir de texto.
+- WaveNet es capaz de producir una voz que suena más natural y humana en comparación con los métodos tradicionales de síntesis de voz basados en texto. Esto se logra modelando la secuencia de sonidos de habla y capturando las características únicas de la voz humana.
+- Además, Google continúa mejorando estos modelos con avances en el campo del procesamiento del lenguaje natural y el aprendizaje profundo para ofrecer una variedad de voces y acentos, así como una mejor interpretación del texto a voz.
+]
+"""
 # Crear la interfaz de Gradio
 iface = gr.Interface(
     fn=convert_pdf_to_audio,
     inputs=gr.File(type="filepath", label="Selecciona un archivo PDF"),  # Tipo de entrada como filepath
     outputs=gr.Audio(type="filepath", label="Audio generado"),
     title="Conversor de PDF a Audio",
+    description="Selecciona un archivo PDF y conviértelo a audio en formato MP3. {bibliotecas_desc} {gtts_desc}",
 )
 # Ejecutar la interfaz