VoxiAI / README.md
Shads229's picture
Upload 11 files
443c1a8 verified
---
title: VoxiAI
emoji: 🎬
colorFrom: yellow
colorTo: red
sdk: docker
pinned: false
---
# VoxiAI 🎬
Application web de génération automatique de sous-titres dynamiques pour vidéos, optimisée pour créer des contenus viraux style TikTok/Reels.
## 🚀 Fonctionnalités
- **Transcription automatique** avec Whisper (faster-whisper)
- **Correction IA intelligente** via DeepSeek pour améliorer la qualité des sous-titres
- **Sous-titres animés** style karaoké avec effet dynamique
- **Pipeline hybride** : traitement audio en parallèle de l'upload vidéo pour une vitesse maximale
- **Streaming vidéo** en temps réel avant finalisation
- **Dashboard analytics** avec statistiques et feedbacks utilisateurs
- **WebSocket** pour mises à jour en temps réel
## 📋 Prérequis
- Python 3.8+
- FFmpeg (avec libx264)
- 2GB RAM minimum
- CPU multi-core recommandé
## 🔧 Installation
1. Cloner le repository
```bash
git clone <votre-repo>
cd VoxiAI
```
2. Installer les dépendances
```bash
pip install -r requirements.txt
```
3. Configurer les variables d'environnement
```bash
cp .env.example .env
# Éditer .env avec vos valeurs
```
4. Lancer l'application
**Version FastAPI (Production):**
```bash
python app.py
```
Accès: http://localhost:7860
**Version Gradio (Simple):**
```bash
python apaap.py
```
## 🔑 Configuration
### Variables d'environnement
- `DEEPSEEK_API_URL`: URL de l'API DeepSeek (défaut: https://ds2api-tau-woad.vercel.app/v1/chat/completions)
- `DEEPSEEK_API_KEY`: Clé API DeepSeek (défaut: sk-ds2api-key-1-your-custom-key)
- `ADMIN_PASSWORD`: Mot de passe pour accéder au dashboard (défaut: admin123)
### Dashboard Admin
Accès: http://localhost:7860/dashboard?password=VOTRE_MOT_DE_PASSE
## 🏗️ Architecture
### Pipeline de Traitement
1. **Extraction audio** côté client (Web Audio API)
2. **Upload parallèle** : audio léger + vidéo complète
3. **Transcription Whisper** pendant l'upload
4. **Correction IA DeepSeek** avec prompt optimisé
5. **Génération sous-titres ASS** avec animations
6. **Incrustation FFmpeg** ultra-rapide
### Technologies
- **Backend**: FastAPI, faster-whisper, aiosqlite
- **IA**: DeepSeek Chat API
- **Frontend**: TailwindCSS, Vanilla JS, WebSocket
- **Traitement**: FFmpeg, Web Audio API
## 📊 Base de Données
SQLite avec 3 tables:
- `visitors`: Tracking des sessions utilisateurs
- `feedback`: Retours utilisateurs
- `tasks`: Historique des traitements vidéo
## 🐳 Docker
```bash
docker build -t voxiai .
docker run -p 7860:7860 voxiai
```
## 👨‍💻 Auteur
Créé par [Shadrak BESSANH](https://www.linkedin.com/in/bessanh-shadrak-744049287/)
## 📝 License
Projet personnel - Tous droits réservés