| ---
|
| title: VoxiAI
|
| emoji: 🎬
|
| colorFrom: yellow
|
| colorTo: red
|
| sdk: docker
|
| pinned: false
|
| ---
|
|
|
| # VoxiAI 🎬
|
|
|
| Application web de génération automatique de sous-titres dynamiques pour vidéos, optimisée pour créer des contenus viraux style TikTok/Reels.
|
|
|
| ## 🚀 Fonctionnalités
|
|
|
| - **Transcription automatique** avec Whisper (faster-whisper)
|
| - **Correction IA intelligente** via DeepSeek pour améliorer la qualité des sous-titres
|
| - **Sous-titres animés** style karaoké avec effet dynamique
|
| - **Pipeline hybride** : traitement audio en parallèle de l'upload vidéo pour une vitesse maximale
|
| - **Streaming vidéo** en temps réel avant finalisation
|
| - **Dashboard analytics** avec statistiques et feedbacks utilisateurs
|
| - **WebSocket** pour mises à jour en temps réel
|
|
|
| ## 📋 Prérequis
|
|
|
| - Python 3.8+
|
| - FFmpeg (avec libx264)
|
| - 2GB RAM minimum
|
| - CPU multi-core recommandé
|
|
|
| ## 🔧 Installation
|
|
|
| 1. Cloner le repository
|
| ```bash
|
| git clone <votre-repo>
|
| cd VoxiAI
|
| ```
|
|
|
| 2. Installer les dépendances
|
| ```bash
|
| pip install -r requirements.txt
|
| ```
|
|
|
| 3. Configurer les variables d'environnement
|
| ```bash
|
| cp .env.example .env
|
| # Éditer .env avec vos valeurs
|
| ```
|
|
|
| 4. Lancer l'application
|
|
|
| **Version FastAPI (Production):**
|
| ```bash
|
| python app.py
|
| ```
|
| Accès: http://localhost:7860
|
|
|
| **Version Gradio (Simple):**
|
| ```bash
|
| python apaap.py
|
| ```
|
|
|
| ## 🔑 Configuration
|
|
|
| ### Variables d'environnement
|
|
|
| - `DEEPSEEK_API_URL`: URL de l'API DeepSeek (défaut: https://ds2api-tau-woad.vercel.app/v1/chat/completions)
|
| - `DEEPSEEK_API_KEY`: Clé API DeepSeek (défaut: sk-ds2api-key-1-your-custom-key)
|
| - `ADMIN_PASSWORD`: Mot de passe pour accéder au dashboard (défaut: admin123)
|
|
|
| ### Dashboard Admin
|
|
|
| Accès: http://localhost:7860/dashboard?password=VOTRE_MOT_DE_PASSE
|
|
|
| ## 🏗️ Architecture
|
|
|
| ### Pipeline de Traitement
|
|
|
| 1. **Extraction audio** côté client (Web Audio API)
|
| 2. **Upload parallèle** : audio léger + vidéo complète
|
| 3. **Transcription Whisper** pendant l'upload
|
| 4. **Correction IA DeepSeek** avec prompt optimisé
|
| 5. **Génération sous-titres ASS** avec animations
|
| 6. **Incrustation FFmpeg** ultra-rapide
|
|
|
| ### Technologies
|
|
|
| - **Backend**: FastAPI, faster-whisper, aiosqlite
|
| - **IA**: DeepSeek Chat API
|
| - **Frontend**: TailwindCSS, Vanilla JS, WebSocket
|
| - **Traitement**: FFmpeg, Web Audio API
|
|
|
| ## 📊 Base de Données
|
|
|
| SQLite avec 3 tables:
|
| - `visitors`: Tracking des sessions utilisateurs
|
| - `feedback`: Retours utilisateurs
|
| - `tasks`: Historique des traitements vidéo
|
|
|
| ## 🐳 Docker
|
|
|
| ```bash
|
| docker build -t voxiai .
|
| docker run -p 7860:7860 voxiai
|
| ```
|
|
|
| ## 👨💻 Auteur
|
|
|
| Créé par [Shadrak BESSANH](https://www.linkedin.com/in/bessanh-shadrak-744049287/)
|
|
|
| ## 📝 License
|
|
|
| Projet personnel - Tous droits réservés
|
| |