Spaces:

Shads229
/

VoxiAI

Running

App Files Files Community

VoxiAI / README.md

Shads229

Upload 11 files

443c1a8 verified about 2 months ago

preview code

raw

history blame contribute delete

2.84 kB

	---
	title: VoxiAI
	emoji: 🎬
	colorFrom: yellow
	colorTo: red
	sdk: docker
	pinned: false
	---

	# VoxiAI 🎬

	Application web de génération automatique de sous-titres dynamiques pour vidéos, optimisée pour créer des contenus viraux style TikTok/Reels.

	## 🚀 Fonctionnalités

	- Transcription automatique avec Whisper (faster-whisper)
	- Correction IA intelligente via DeepSeek pour améliorer la qualité des sous-titres
	- Sous-titres animés style karaoké avec effet dynamique
	- Pipeline hybride : traitement audio en parallèle de l'upload vidéo pour une vitesse maximale
	- Streaming vidéo en temps réel avant finalisation
	- Dashboard analytics avec statistiques et feedbacks utilisateurs
	- WebSocket pour mises à jour en temps réel

	## 📋 Prérequis

	- Python 3.8+
	- FFmpeg (avec libx264)
	- 2GB RAM minimum
	- CPU multi-core recommandé

	## 🔧 Installation

	1. Cloner le repository
	```bash
	git clone <votre-repo>
	cd VoxiAI
	```

	2. Installer les dépendances
	```bash
	pip install -r requirements.txt
	```

	3. Configurer les variables d'environnement
	```bash
	cp .env.example .env
	# Éditer .env avec vos valeurs
	```

	4. Lancer l'application

	Version FastAPI (Production):
	```bash
	python app.py
	```
	Accès: http://localhost:7860

	Version Gradio (Simple):
	```bash
	python apaap.py
	```

	## 🔑 Configuration

	### Variables d'environnement

	- `DEEPSEEK_API_URL`: URL de l'API DeepSeek (défaut: https://ds2api-tau-woad.vercel.app/v1/chat/completions)
	- `DEEPSEEK_API_KEY`: Clé API DeepSeek (défaut: sk-ds2api-key-1-your-custom-key)
	- `ADMIN_PASSWORD`: Mot de passe pour accéder au dashboard (défaut: admin123)

	### Dashboard Admin

	Accès: http://localhost:7860/dashboard?password=VOTRE_MOT_DE_PASSE

	## 🏗️ Architecture

	### Pipeline de Traitement

	1. Extraction audio côté client (Web Audio API)
	2. Upload parallèle : audio léger + vidéo complète
	3. Transcription Whisper pendant l'upload
	4. Correction IA DeepSeek avec prompt optimisé
	5. Génération sous-titres ASS avec animations
	6. Incrustation FFmpeg ultra-rapide

	### Technologies

	- Backend: FastAPI, faster-whisper, aiosqlite
	- IA: DeepSeek Chat API
	- Frontend: TailwindCSS, Vanilla JS, WebSocket
	- Traitement: FFmpeg, Web Audio API

	## 📊 Base de Données

	SQLite avec 3 tables:
	- `visitors`: Tracking des sessions utilisateurs
	- `feedback`: Retours utilisateurs
	- `tasks`: Historique des traitements vidéo

	## 🐳 Docker

	```bash
	docker build -t voxiai .
	docker run -p 7860:7860 voxiai
	```

	## 👨‍💻 Auteur

	Créé par [Shadrak BESSANH](https://www.linkedin.com/in/bessanh-shadrak-744049287/)

	## 📝 License

	Projet personnel - Tous droits réservés