--- title: VoxiAI emoji: 🎬 colorFrom: yellow colorTo: red sdk: docker pinned: false --- # VoxiAI 🎬 Application web de génération automatique de sous-titres dynamiques pour vidéos, optimisée pour créer des contenus viraux style TikTok/Reels. ## 🚀 Fonctionnalités - **Transcription automatique** avec Whisper (faster-whisper) - **Correction IA intelligente** via DeepSeek pour améliorer la qualité des sous-titres - **Sous-titres animés** style karaoké avec effet dynamique - **Pipeline hybride** : traitement audio en parallèle de l'upload vidéo pour une vitesse maximale - **Streaming vidéo** en temps réel avant finalisation - **Dashboard analytics** avec statistiques et feedbacks utilisateurs - **WebSocket** pour mises à jour en temps réel ## 📋 Prérequis - Python 3.8+ - FFmpeg (avec libx264) - 2GB RAM minimum - CPU multi-core recommandé ## 🔧 Installation 1. Cloner le repository ```bash git clone cd VoxiAI ``` 2. Installer les dépendances ```bash pip install -r requirements.txt ``` 3. Configurer les variables d'environnement ```bash cp .env.example .env # Éditer .env avec vos valeurs ``` 4. Lancer l'application **Version FastAPI (Production):** ```bash python app.py ``` Accès: http://localhost:7860 **Version Gradio (Simple):** ```bash python apaap.py ``` ## 🔑 Configuration ### Variables d'environnement - `DEEPSEEK_API_URL`: URL de l'API DeepSeek (défaut: https://ds2api-tau-woad.vercel.app/v1/chat/completions) - `DEEPSEEK_API_KEY`: Clé API DeepSeek (défaut: sk-ds2api-key-1-your-custom-key) - `ADMIN_PASSWORD`: Mot de passe pour accéder au dashboard (défaut: admin123) ### Dashboard Admin Accès: http://localhost:7860/dashboard?password=VOTRE_MOT_DE_PASSE ## 🏗️ Architecture ### Pipeline de Traitement 1. **Extraction audio** côté client (Web Audio API) 2. **Upload parallèle** : audio léger + vidéo complète 3. **Transcription Whisper** pendant l'upload 4. **Correction IA DeepSeek** avec prompt optimisé 5. **Génération sous-titres ASS** avec animations 6. **Incrustation FFmpeg** ultra-rapide ### Technologies - **Backend**: FastAPI, faster-whisper, aiosqlite - **IA**: DeepSeek Chat API - **Frontend**: TailwindCSS, Vanilla JS, WebSocket - **Traitement**: FFmpeg, Web Audio API ## 📊 Base de Données SQLite avec 3 tables: - `visitors`: Tracking des sessions utilisateurs - `feedback`: Retours utilisateurs - `tasks`: Historique des traitements vidéo ## 🐳 Docker ```bash docker build -t voxiai . docker run -p 7860:7860 voxiai ``` ## 👨‍💻 Auteur Créé par [Shadrak BESSANH](https://www.linkedin.com/in/bessanh-shadrak-744049287/) ## 📝 License Projet personnel - Tous droits réservés