Spaces:

Expertnocode
/

event-video-avatar-generator

Runtime error

App Files Files Community

event-video-avatar-generator / README.md

Expertnocode

Upload README.md with huggingface_hub

d4af354 verified 5 months ago

preview code

raw

history blame contribute delete

4.52 kB

A newer version of the Gradio SDK is available: 6.13.0

Upgrade

metadata

title: Event Video Avatar Generator
emoji: 🎬
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.9.1
app_file: app.py
pinned: false
license: mit

🎬 Générateur de Vidéo Événementielle avec Avatar Parlant

Une application Gradio qui vous permet de créer des vidéos professionnelles pour vos événements en combinant :

🏛️ Des vidéos animées de vos lieux événementiels
👤 Un avatar parlant personnalisable en premier plan

✨ Fonctionnalités

1️⃣ Génération de vidéo de fond

Upload d'images de votre lieu événementiel
Transformation automatique en vidéo animée avec mouvement de caméra
Personnalisation du prompt pour contrôler l'animation

2️⃣ Création d'avatar parlant

Upload d'une image d'avatar (visage)
Synchronisation labiale avec votre audio
Choix entre plusieurs modèles (LatentSync, EchoMimic)

3️⃣ Composition vidéo finale

Incrustation de l'avatar sur la vidéo de fond
Contrôle de la position (coins, centre)
Ajustement de la taille de l'avatar

🚀 Utilisation

Workflow complet

Préparer vos assets
- Images de votre lieu (format JPG, PNG)
- Image de l'avatar (portrait, visage face caméra)
- Fichier audio (voix de l'avatar)
Générer la vidéo de fond
- Allez dans l'onglet "Vidéo de Fond"
- Uploadez vos images
- Personnalisez le prompt (optionnel)
- Cliquez sur "Générer"
Créer l'avatar parlant
- Allez dans l'onglet "Avatar Parlant"
- Uploadez l'image de l'avatar
- Uploadez le fichier audio
- Choisissez le modèle
- Cliquez sur "Générer"
Composer la vidéo finale
- Allez dans l'onglet "Composition Finale"
- Sélectionnez les deux vidéos générées
- Ajustez position et taille
- Cliquez sur "Composer"

🛠️ Technologies

Wan2.2 14B - Génération vidéo image-to-video
LatentSync - Synchronisation labiale avec diffusion latente
EchoMimic - Animation de portrait audio-driven
OpenCV - Composition et traitement vidéo
Gradio - Interface utilisateur

💡 Conseils pour de meilleurs résultats

Images du lieu

Utilisez des images de haute qualité (minimum 1080p)
Privilégiez un bon éclairage
Variez les angles pour plus de dynamisme

Avatar

Utilisez un portrait face caméra, bien éclairé
Fond uni ou flou recommandé
Expression neutre de préférence

Audio

Qualité audio claire, sans bruit de fond
Parlez distinctement
Formats supportés : MP3, WAV, M4A

📝 Exemples de prompts pour la vidéo de fond

"Smooth cinematic camera movement through the elegant wedding venue"
"Dynamic panning shot showcasing the modern conference hall"
"Gentle dolly movement highlighting the beautiful garden event space"
"Aerial-style movement over the stunning rooftop venue"

🔧 Configuration technique

Modèles disponibles pour l'avatar

LatentSync (Recommandé)

Meilleure qualité de synchronisation labiale
Plus stable et cohérent
Temps de génération : ~2-3 minutes

EchoMimic

Animation plus expressive
Bonne pour les mouvements naturels
Temps de génération : ~2-4 minutes

🎯 Cas d'usage

🎪 Vidéos de présentation de lieux événementiels
💒 Invitations vidéo personnalisées
🏢 Présentations commerciales immobilières
🎓 Visites virtuelles guidées
🎉 Annonces d'événements

⚠️ Limitations

Les vidéos générées durent généralement 3-5 secondes
Le temps de génération peut varier selon la charge serveur
La qualité dépend de la qualité des images sources
Certaines expressions faciales complexes peuvent être approximatives

📄 Licence

MIT License - Libre d'utilisation pour projets personnels et commerciaux

👨‍💻 Auteur

Expertnocode (Ulysse Grosjean)

Expert en automatisation et intégration IA
Full-stack developer & consultant technique

🤝 Contribution

Les contributions sont les bienvenues ! N'hésitez pas à :

Signaler des bugs
Proposer de nouvelles fonctionnalités
Améliorer la documentation

🔗 Liens utiles

Fait avec ❤️ et IA