VoicePoweredAI_Spanish_v1 / README.md

jpgallegoar

Update README.md

8c910cd verified 8 months ago

preview code

raw

history blame contribute delete

1.05 kB

metadata

license: cc-by-nc-2.0
library_name: f5-tts
language:
  - es
base_model:
  - SWivid/F5-TTS

VoicePowered v1

Presentamos VoicePowered v1, un modelo Text to Speech open source centrado en la clonación de voces con acento español. Este modelo es un fine-tuning del modelo F5-TTS (https://huggingface.co/SWivid/F5-TTS)

Ofrecemos una app Gradio donde probar el modelo. Esta app incluye generación de una voz y generación multi-voz.

Para la selección de los audios de referencia, por favor sigan las siguientes pautas.

El audio de referencia debe durar menos de 15 segundos. Dentro de estos 15 segundos, debe haber un pequeño silencio al principio y al final del audio. Preferiblemente, dentro del audio debe haber frases completas.
El modelo utilizará las características de este audio para la generación, incluyendo la velocidad del habla, la prosodia, la emoción, las pronunciaciones, e incluso la calidad del audio, por lo que hay que asegurarse que se utiliza un audio de referencia con las características del audio deseado.