Spaces:

lmah
/

PROYECTO1

Runtime error

App Files Files Community

lmah commited on Nov 16, 2024

Commit

cbfc0a3

verified ·

1 Parent(s): 2c82426

Update README.md

Browse files

Files changed (1) hide show

README.md +37 -1

README.md CHANGED Viewed

@@ -8,6 +8,42 @@ sdk_version: 5.6.0
 app_file: app.py
 pinned: false
 short_description: 'Proyecto 1: Una aplicación práctica usando modelos'
----
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 app_file: app.py
 pinned: false
 short_description: 'Proyecto 1: Una aplicación práctica usando modelos'
+--------------------------------------------------------------------------------------------------
+## Generación de Contenido Multimedia a partir de Texto
+### Definición del Problema
+El problema que queremos resolver es la generación de contenido multimedia a partir de texto. Específicamente, queremos convertir
+texto en voz y generar una imagen relacionada con el contenido del texto. Esta solución puede ser útil en aplicaciones educativas,
+de entretenimiento y accesibilidad.
+### Descripción del Input
+- **Texto**: El usuario debe proporcionar un texto que describa el contenido que desea convertir en voz y la imagen que desea generar.
+- El texto debe tener entre 3 y 2000 caracteres.
+### Descripción del Output
+- **Audio**: Un archivo de audio generado a partir del texto proporcionado.
+- **Imagen**: Una imagen generada que represente el contenido del texto proporcionado.
+### Descripción de los Modelos Utilizados
+1. **SpeechT5 (TTS task)**:
+   - **Descripción**: SpeechT5 es un modelo de texto a voz (Text-to-Speech) que convierte texto en audio. Utiliza un vocoder para generar
+   -  el audio final.
+   - **Clasificación**: Modelo de síntesis de voz.
+   - **Limitaciones**: La calidad del audio generado puede variar dependiendo del texto y del vocoder utilizado.
+   - Además, puede requerir ajustes finos para diferentes idiomas y acentos.
+2. **Runware API**:
+   - **Descripción**: La API de Runware se utiliza para generar imágenes a partir de descripciones textuales.
+   - Utiliza modelos preentrenados para interpretar el texto y generar imágenes relevantes.
+   - **Clasificación**: Modelo de generación de imágenes.
+   - **Limitaciones**: La calidad y relevancia de las imágenes generadas pueden variar dependiendo de la descripción textual proporcionada.
+   -  Además, la API puede tener limitaciones en términos de número de solicitudes y tiempo de respuesta.
+### Limitaciones de los Modelos
+- **SpeechT5**: La calidad del audio puede variar y puede requerir ajustes para diferentes idiomas y acentos.
+- **Runware API**: La calidad y relevancia de las imágenes generadas pueden variar y la API puede tener limitaciones en términos de
+- número de solicitudes y tiempo de respuesta.
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference