Spaces:
Runtime error
Runtime error
A newer version of the Gradio SDK is available: 6.13.0
metadata
title: Event Video Avatar Generator
emoji: 🎬
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.9.1
app_file: app.py
pinned: false
license: mit
🎬 Générateur de Vidéo Événementielle avec Avatar Parlant
Une application Gradio qui vous permet de créer des vidéos professionnelles pour vos événements en combinant :
- 🏛️ Des vidéos animées de vos lieux événementiels
- 👤 Un avatar parlant personnalisable en premier plan
✨ Fonctionnalités
1️⃣ Génération de vidéo de fond
- Upload d'images de votre lieu événementiel
- Transformation automatique en vidéo animée avec mouvement de caméra
- Personnalisation du prompt pour contrôler l'animation
2️⃣ Création d'avatar parlant
- Upload d'une image d'avatar (visage)
- Synchronisation labiale avec votre audio
- Choix entre plusieurs modèles (LatentSync, EchoMimic)
3️⃣ Composition vidéo finale
- Incrustation de l'avatar sur la vidéo de fond
- Contrôle de la position (coins, centre)
- Ajustement de la taille de l'avatar
🚀 Utilisation
Workflow complet
Préparer vos assets
- Images de votre lieu (format JPG, PNG)
- Image de l'avatar (portrait, visage face caméra)
- Fichier audio (voix de l'avatar)
Générer la vidéo de fond
- Allez dans l'onglet "Vidéo de Fond"
- Uploadez vos images
- Personnalisez le prompt (optionnel)
- Cliquez sur "Générer"
Créer l'avatar parlant
- Allez dans l'onglet "Avatar Parlant"
- Uploadez l'image de l'avatar
- Uploadez le fichier audio
- Choisissez le modèle
- Cliquez sur "Générer"
Composer la vidéo finale
- Allez dans l'onglet "Composition Finale"
- Sélectionnez les deux vidéos générées
- Ajustez position et taille
- Cliquez sur "Composer"
🛠️ Technologies
- Wan2.2 14B - Génération vidéo image-to-video
- LatentSync - Synchronisation labiale avec diffusion latente
- EchoMimic - Animation de portrait audio-driven
- OpenCV - Composition et traitement vidéo
- Gradio - Interface utilisateur
💡 Conseils pour de meilleurs résultats
Images du lieu
- Utilisez des images de haute qualité (minimum 1080p)
- Privilégiez un bon éclairage
- Variez les angles pour plus de dynamisme
Avatar
- Utilisez un portrait face caméra, bien éclairé
- Fond uni ou flou recommandé
- Expression neutre de préférence
Audio
- Qualité audio claire, sans bruit de fond
- Parlez distinctement
- Formats supportés : MP3, WAV, M4A
📝 Exemples de prompts pour la vidéo de fond
- "Smooth cinematic camera movement through the elegant wedding venue"
- "Dynamic panning shot showcasing the modern conference hall"
- "Gentle dolly movement highlighting the beautiful garden event space"
- "Aerial-style movement over the stunning rooftop venue"
🔧 Configuration technique
Modèles disponibles pour l'avatar
LatentSync (Recommandé)
- Meilleure qualité de synchronisation labiale
- Plus stable et cohérent
- Temps de génération : ~2-3 minutes
EchoMimic
- Animation plus expressive
- Bonne pour les mouvements naturels
- Temps de génération : ~2-4 minutes
🎯 Cas d'usage
- 🎪 Vidéos de présentation de lieux événementiels
- 💒 Invitations vidéo personnalisées
- 🏢 Présentations commerciales immobilières
- 🎓 Visites virtuelles guidées
- 🎉 Annonces d'événements
⚠️ Limitations
- Les vidéos générées durent généralement 3-5 secondes
- Le temps de génération peut varier selon la charge serveur
- La qualité dépend de la qualité des images sources
- Certaines expressions faciales complexes peuvent être approximatives
📄 Licence
MIT License - Libre d'utilisation pour projets personnels et commerciaux
👨💻 Auteur
Expertnocode (Ulysse Grosjean)
- Expert en automatisation et intégration IA
- Full-stack developer & consultant technique
🤝 Contribution
Les contributions sont les bienvenues ! N'hésitez pas à :
- Signaler des bugs
- Proposer de nouvelles fonctionnalités
- Améliorer la documentation
🔗 Liens utiles
Fait avec ❤️ et IA