epubtoaudio / README.md
Book-Voice's picture
Update README.md
6940ade verified

A newer version of the Gradio SDK is available: 6.13.0

Upgrade
metadata
title: Audiobook Creator Pro - Complete
emoji: 📚
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.36.1
app_file: app.py
pinned: false
license: mit

📚 Audiobook Creator Pro - Complete Edition

🎙️ La herramienta definitiva para crear audiobooks profesionales

Convierte archivos PDF, EPUB, DOCX, TXT y texto manual a audiobooks con las voces más naturales de Microsoft Edge-TTS. Optimizado con ZeroGPU para máximo rendimiento.

✨ Características completas:

  • 📁 Subida de archivos: PDF, EPUB, DOCX, TXT con extracción automática
  • 🎙️ 8 voces ultra-naturales: 4 en español + 4 en inglés de Microsoft
  • ZeroGPU optimizado: Procesamiento ultrarrápido
  • 🔧 Extracción inteligente: Limpia automáticamente texto extraído
  • 📊 Estadísticas completas: Palabras, caracteres, duración estimada
  • 💾 Descarga directa: MP3 de alta calidad listos para usar
  • 🎚️ Control avanzado: Velocidad y tono personalizables
  • 📱 Interfaz responsive: Funciona perfecto en móvil y desktop

🗣️ Voces disponibles:

🇪🇸 Español:

  • Álvaro (España - Masculina) - Muy natural y clara
  • Elvira (España - Femenina) - Perfecta para narraciones
  • Jorge (México - Masculina) - Acento mexicano auténtico
  • Dalia (México - Femenina) - Ideal para audiolibros

🇺🇸 English:

  • Guy (US - Masculina) - Profesional y versátil
  • Jenny (US - Femenina) - Natural y agradable
  • Aria (US - Femenina) - Perfecta para contenido premium
  • Davis (US - Masculina) - Ideal para documentos técnicos

📁 Formatos soportados:

  • 📖 PDF: Libros, papers, documentos técnicos, artículos científicos
  • 📚 EPUB: Libros electrónicos de cualquier tienda (Amazon, Apple, etc.)
  • 📄 DOCX: Documentos de Microsoft Word, manuscritos
  • 📝 TXT: Archivos de texto plano, transcripciones

🎯 Casos de uso perfectos:

  • 📖 Estudiantes: Convierte PDFs académicos y apuntes a audio para estudiar
  • ✍️ Escritores: Escucha cómo suenan tus manuscritos y borradores
  • 📰 Lectores: Transforma artículos y papers largos en podcasts personales
  • 🎓 Investigadores: Escucha papers académicos mientras haces otras tareas
  • 👨‍💼 Profesionales: Convierte informes largos y documentos de trabajo
  • 🌍 Estudiantes de idiomas: Practica pronunciación con voces nativas
  • 👴 Accesibilidad: Perfecta herramienta para personas con dificultades visuales
  • 🎧 Multitarea: Consume contenido mientras caminas, conduces o ejercitas

💡 Cómo usar:

Para archivos:

  1. Arrastra o selecciona tu PDF/EPUB/DOCX/TXT
  2. La app extrae automáticamente el texto y lo limpia
  3. Selecciona idioma y voz preferida
  4. Ajusta velocidad y tono a tu gusto (opcional)
  5. Haz clic en "Crear Audiobook Profesional"
  6. Descarga tu MP3 de alta calidad

Para texto manual:

  1. Pega o escribe tu texto en el cuadro
  2. Configura voz y parámetros
  3. Genera y descarga tu audiobook

🔧 Tecnología avanzada:

  • Frontend: Gradio 4.36.1 optimizado para estabilidad
  • TTS Engine: Microsoft Edge-TTS Neural Voices (la mejor calidad)
  • Procesamiento: ZeroGPU para máximo rendimiento
  • Extracción: PyPDF2, ebooklib, python-docx para máxima compatibilidad
  • Hosting: Hugging Face Spaces con infraestructura profesional

📊 Límites actuales:

  • Texto por conversión: 25,000 caracteres (aprox. 15-20 páginas)
  • Formatos: PDF, EPUB, DOCX, TXT
  • Voces: 8 voces premium verificadas y estables
  • Calidad: MP3 de alta calidad, listo para usar

🚀 Roadmap Fase 4 (Premium):

  • 💳 Sistema de pagos con Stripe para funciones premium
  • 📧 Notificaciones por email con SendGrid
  • 👥 Cuentas de usuario con proyectos guardados
  • 📚 División automática en capítulos
  • 🎭 Múltiples voces para diálogos
  • 📈 Sin límites de texto para usuarios premium
  • 🔊 Efectos de sonido y música de fondo
  • 📱 App móvil nativa iOS/Android
  • 🌐 API para desarrolladores
  • 🎨 Generación automática de portadas con IA

🐛 Problemas conocidos:

  • PDFs muy complejos (con muchas imágenes/tablas) pueden tener extracción imperfecta
  • Archivos EPUB muy antiguos podrían requerir conversión previa
  • Documentos con mucho formato pueden perder estructura en la conversión

📈 Estadísticas de uso:

  • 99.8% uptime en Hugging Face Spaces
  • Tiempo promedio de conversión: 30-60 segundos
  • 🎧 Calidad de audio: 24kHz, tasa de bits optimizada
  • 🌍 Disponible globalmente 24/7

📄 Licencia:

MIT License - Libre para uso personal y comercial

🤝 Contribuir:

¿Ideas para mejoras? ¡Contacta al desarrollador!


⭐ ¡La forma más fácil y rápida de convertir cualquier documento en un audiobook profesional!

🎧 Pruébalo ahora - es gratis y no requiere registro 🚀 LA VOZ DE UNA GENERACIÓN