VoicePoweredAI
/

VoicePoweredAI_Spanish_v1

Model card Files Files and versions

VoicePoweredAI_Spanish_v1 / README.md

jpgallegoar's picture

Update README.md

8c910cd verified 8 months ago

|

history blame contribute delete

1.05 kB

	---
	license: cc-by-nc-2.0
	library_name: f5-tts
	language:
	- es
	base_model:
	- SWivid/F5-TTS
	---
	# VoicePowered v1

	Presentamos VoicePowered v1, un modelo Text to Speech open source centrado en la clonación de voces con acento español. Este modelo es un fine-tuning del modelo F5-TTS (https://huggingface.co/SWivid/F5-TTS)

	Ofrecemos una app Gradio donde probar el modelo. Esta app incluye generación de una voz y generación multi-voz.

	Para la selección de los audios de referencia, por favor sigan las siguientes pautas.

	- El audio de referencia debe durar menos de 15 segundos. Dentro de estos 15 segundos, debe haber un pequeño silencio al principio y al final del audio. Preferiblemente, dentro del audio debe haber frases completas.
	- El modelo utilizará las características de este audio para la generación, incluyendo la velocidad del habla, la prosodia, la emoción, las pronunciaciones, e incluso la calidad del audio, por lo que hay que asegurarse que se utiliza un audio de referencia con las características del audio deseado.