Modelos TTS de HirCoir
Este repositorio contiene una colección de modelos de texto a voz (TTS) en formato .onnx desarrollados por el Team HirLab. Todos estos modelos son el resultado de un arduo trabajo de entrenamiento, procesamiento de datasets y colaboración dentro de nuestro equipo.
¿Qué es Piper TTS?
Piper TTS es un sistema de texto a voz neuronal local y rápido, optimizado para dispositivos como Raspberry Pi 4. Fue desarrollado por el equipo de Rhasspy y está diseñado para ofrecer síntesis de voz de alta calidad sin depender de servicios en la nube, lo que lo hace ideal para aplicaciones que requieren privacidad y funcionamiento offline.
Modelos .ONNX
Los modelos en este repositorio están en formato ONNX (Open Neural Network Exchange), un estándar abierto para modelos de machine learning que permite interoperabilidad entre diferentes frameworks. En el contexto de Piper TTS, estos modelos han sido entrenados con VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) y exportados a ONNX Runtime para una ejecución eficiente.
Cada modelo viene acompañado de un archivo .json de configuración que contiene información sobre parámetros como velocidad de habla, nivel de ruido y mapeos fonémicos.
Modelos disponibles
Modelos generales
Romulus_v1.onnxYiseni.onnxkamora.onnx
Voz en español argentino (es_ARG)
es_ARG-Elena.onnx
Voces en español mexicano (es_MX)
es_MX-1PesoDeSalsa-high.onnxes_MX-Darkred.onnxes_MX-DocTops.onnxes_MX-HirCoir.onnxes_MX-Maney.onnxes_MX-Nate.onnxes_MX-Sorah_V2.onnxes_MX-Veritasium-high.onnxes_MX-Yahir.onnxes_MX-claude-14947-epoch-high.onnxes_MX-emma-high.onnxes_MX-laura-high.onnxes_MX-laura_v2.onnxes_MX-lilith.onnxes_MX-modelo1-high.onnxes_MX-sorah-high.onnxes_MX_Lucasmelor-high.onnxes_mx-Adam.onnx
Cada modelo incluye su respectivo archivo de configuración .onnx.json.
Acerca de nuestro trabajo
Todos estos modelos son el resultado de un arduo trabajo de:
- Entrenamiento de modelos de texto a voz
- Procesamiento y curación de datasets
- Experimentación y optimización
- Trabajo colaborativo del Team HirLab
La mayoría de estos modelos están disponibles para probarlos en tts.hircoir.eu.org.
Acceso a modelos privados
De momento, no se aprobará el acceso a los modelos privados a nadie. Esta medida se debe a que estamos en proceso de perfeccionamiento y validación de dichos modelos, así como estableciendo los lineamientos adecuados para su distribución.
Licencia futura
Aunque actualmente no se aplican términos de licencia específicos a estos modelos, si llega el momento de liberarlos oficialmente, todos tendrán la siguiente licencia:
Términos de Uso para el Modelo de Voz TTS
Licencia de Uso
Este modelo de voz TTS se proporciona de forma gratuita bajo las siguientes condiciones:
Uso Permitido
- Uso Personal y No Comercial: Puede utilizar este modelo para proyectos personales, educativos o de investigación.
- Monetización de Contenidos: El modelo puede ser utilizado en contenidos monetizados como videos de YouTube, podcasts o similares, siempre y cuando el modelo en sí no sea el producto principal que se monetiza.
- Redistribución Gratuita: Puede compartir este modelo con otros siempre que estos términos se mantengan intactos y no se cobren tarifas por su distribución.
Uso Prohibido
- Venta Directa o Indirecta: No está permitido vender este modelo, cobrar por su uso o incluirlo en productos o servicios comerciales.
- Redistribución Comercial: La redistribución de este modelo con fines comerciales, incluso si está modificado, está estrictamente prohibida.
- Modificaciones para la Venta: No se permite modificar este modelo para crear versiones comerciales o para usarlo con fines de lucro.
Atribución
Si utiliza este modelo en algún proyecto, se agradecería incluir una atribución visible con el siguiente texto:
"Modelo de Voz TTS proporcionado por hircoir.eu.org"
Nota: Esta atribución es completamente opcional y no obligatoria.
Exención de Responsabilidad
Este modelo se proporciona "tal cual", sin garantía de ningún tipo, expresa o implícita. El autor no es responsable del mal uso de este modelo ni de los daños que puedan derivarse de su uso.
Uso
Para utilizar estos modelos con Piper TTS, necesitarás:
- Instalar Piper TTS
- Descargar el modelo
.onnxy su archivo de configuración.onnx.json - Colocar ambos archivos en la misma carpeta
- Ejecutar Piper TTS apuntando a ese modelo