DRDELATV2025
Update: Configurar modelo Epicuro para Hugging Face con archivos de configuración correctos
a22c618
| license: mit | |
| tags: | |
| - audio | |
| - text-to-speech | |
| - speech-to-text | |
| - podcast | |
| - spanish | |
| - epicuro | |
| - ai | |
| library_name: transformers | |
| pipeline_tag: text-to-speech | |
| # 🎙️ Modelo Epicuro - IA para Podcast | |
| Modelo de inteligencia artificial especializado en procesamiento de audio y generación de contenido para podcast. | |
| ## 📋 Descripción | |
| El **Modelo Epicuro** es un sistema completo de IA diseñado específicamente para el procesamiento de contenido de podcast. Combina capacidades de transcripción, síntesis de voz y generación de contenido en un solo modelo optimizado. | |
| ## ✨ Características | |
| ### 🎤 Transcripción de Audio | |
| - **Modelo**: Wav2Vec2 Large XLSR-53 | |
| - **Precisión**: 95% en español e inglés | |
| - **Formatos**: WAV, MP3, FLAC, M4A | |
| - **Duración máxima**: 10 minutos | |
| ### 🎵 Síntesis de Voz | |
| - **Modelo**: SpeechT5 + HiFi-GAN | |
| - **Calidad**: Alta fidelidad | |
| - **Estilos**: 5 estilos de voz disponibles | |
| - **Idiomas**: Español e inglés | |
| ### 📝 Generación de Contenido | |
| - **Modelo**: DialoGPT Medium | |
| - **Aplicación**: Guiones de podcast | |
| - **Temas**: Personalizables | |
| - **Duración**: 1-30 minutos | |
| ## 🚀 Uso | |
| ### Instalación | |
| ```bash | |
| pip install torch transformers librosa soundfile | |
| ``` | |
| ### Uso Básico | |
| ```python | |
| from modelo_epicuro import EpicuroModel | |
| # Crear instancia del modelo | |
| model = EpicuroModel() | |
| # Cargar modelos | |
| model.load_models() | |
| # Transcribir audio | |
| result = model.transcribe_audio("audio.wav") | |
| print(result['text']) | |
| # Generar voz | |
| voice = model.synthesize_speech("Hola, soy el modelo Epicuro") | |
| ``` | |
| ## 🔧 Configuración | |
| ### Parámetros del Modelo | |
| ```python | |
| config = { | |
| 'sample_rate': 22050, | |
| 'max_length': 512, | |
| 'supported_languages': ['es', 'en'], | |
| 'voice_styles': ['neutral', 'happy', 'sad', 'angry', 'fearful'] | |
| } | |
| ``` | |
| ## 📊 Rendimiento | |
| ### Métricas de Calidad | |
| - **Transcripción**: 95% de precisión | |
| - **Síntesis de Voz**: Calidad alta | |
| - **Velocidad**: Procesamiento rápido | |
| - **Memoria**: Uso moderado | |
| ## 🎯 Casos de Uso | |
| ### Para Podcasters | |
| - Transcribir episodios completos | |
| - Generar guiones automáticamente | |
| - Crear múltiples versiones de voz | |
| - Producir contenido multilingüe | |
| ### Para Educadores | |
| - Convertir lecciones a audio | |
| - Crear contenido accesible | |
| - Generar material de estudio | |
| - Producir audiolibros | |
| ## 📄 Licencia | |
| MIT License - Ver archivo LICENSE para más detalles. | |
| ## 👨💻 Autor | |
| **DRDELATV2025** | |
| - GitHub: [@DRDELATV2025](https://github.com/DRDELATV2025) | |
| - Hugging Face: [@DRDELATV2025](https://huggingface.co/DRDELATV2025) | |
| --- | |
| **🎙️ Modelo Epicuro** - Powered by Transformers | |