metadata
title: VoxiAI
emoji: 🎬
colorFrom: yellow
colorTo: red
sdk: docker
pinned: false
VoxiAI 🎬
Application web de génération automatique de sous-titres dynamiques pour vidéos, optimisée pour créer des contenus viraux style TikTok/Reels.
🚀 Fonctionnalités
- Transcription automatique avec Whisper (faster-whisper)
- Correction IA intelligente via DeepSeek pour améliorer la qualité des sous-titres
- Sous-titres animés style karaoké avec effet dynamique
- Pipeline hybride : traitement audio en parallèle de l'upload vidéo pour une vitesse maximale
- Streaming vidéo en temps réel avant finalisation
- Dashboard analytics avec statistiques et feedbacks utilisateurs
- WebSocket pour mises à jour en temps réel
📋 Prérequis
- Python 3.8+
- FFmpeg (avec libx264)
- 2GB RAM minimum
- CPU multi-core recommandé
🔧 Installation
- Cloner le repository
git clone <votre-repo>
cd VoxiAI
- Installer les dépendances
pip install -r requirements.txt
- Configurer les variables d'environnement
cp .env.example .env
# Éditer .env avec vos valeurs
- Lancer l'application
Version FastAPI (Production):
python app.py
Accès: http://localhost:7860
Version Gradio (Simple):
python apaap.py
🔑 Configuration
Variables d'environnement
DEEPSEEK_API_URL: URL de l'API DeepSeek (défaut: https://ds2api-tau-woad.vercel.app/v1/chat/completions)DEEPSEEK_API_KEY: Clé API DeepSeek (défaut: sk-ds2api-key-1-your-custom-key)ADMIN_PASSWORD: Mot de passe pour accéder au dashboard (défaut: admin123)
Dashboard Admin
Accès: http://localhost:7860/dashboard?password=VOTRE_MOT_DE_PASSE
🏗️ Architecture
Pipeline de Traitement
- Extraction audio côté client (Web Audio API)
- Upload parallèle : audio léger + vidéo complète
- Transcription Whisper pendant l'upload
- Correction IA DeepSeek avec prompt optimisé
- Génération sous-titres ASS avec animations
- Incrustation FFmpeg ultra-rapide
Technologies
- Backend: FastAPI, faster-whisper, aiosqlite
- IA: DeepSeek Chat API
- Frontend: TailwindCSS, Vanilla JS, WebSocket
- Traitement: FFmpeg, Web Audio API
📊 Base de Données
SQLite avec 3 tables:
visitors: Tracking des sessions utilisateursfeedback: Retours utilisateurstasks: Historique des traitements vidéo
🐳 Docker
docker build -t voxiai .
docker run -p 7860:7860 voxiai
👨💻 Auteur
Créé par Shadrak BESSANH
📝 License
Projet personnel - Tous droits réservés