Update README.md
Browse files
README.md
CHANGED
|
@@ -1,3 +1,10 @@
|
|
| 1 |
-
|
| 2 |
-
|
| 3 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# VoicePowered v1
|
| 2 |
+
|
| 3 |
+
Presentamos VoicePowered v1, un modelo Text to Speech open source centrado en la clonaci贸n de voces con acento espa帽ol. Este modelo es un fine-tuning del modelo F5-TTS (https://huggingface.co/SWivid/F5-TTS)
|
| 4 |
+
|
| 5 |
+
Ofrecemos una app Gradio donde probar el modelo. Esta app incluye generaci贸n de una voz y generaci贸n multi-voz.
|
| 6 |
+
|
| 7 |
+
Para la selecci贸n de los audios de referencia, por favor sigan las siguientes pautas.
|
| 8 |
+
|
| 9 |
+
- El audio de referencia debe durar menos de 15 segundos. Dentro de estos 15 segundos, debe haber un peque帽o silencio al principio y al final del audio. Preferiblemente, dentro del audio debe haber frases completas.
|
| 10 |
+
- El modelo utilizar谩 las caracter铆sticas de este audio para la generaci贸n, incluyendo la velocidad del habla, la prosodia, la emoci贸n, las pronunciaciones, e incluso la calidad del audio, por lo que hay que asegurarse que se utiliza un audio de referencia con las caracter铆sticas del audio deseado.
|