File size: 2,707 Bytes
a0932ee |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 |
# 🎬 Как использовать MeiGen-MultiTalk Demo
## 🚀 Быстрый старт
### 1. Откройте приложение
- **Локально**: http://localhost:8501
- **Hugging Face**: https://rocketmandrey-phunter-space.hf.space
### 2. Загрузите файлы
- **Изображение**: PNG, JPG, JPEG (лицо человека, фронтальный ракурс)
- **Аудио**: MP3, WAV, OGG, M4A (чистая речь, 1-15 секунд)
### 3. Настройте параметры
- **Prompt**: Опишите стиль разговора (например: "Человек говорит эмоционально и выразительно")
- **Audio CFG**: 3.0-5.0 (точность синхронизации губ)
- **Guidance Scale**: 7.5 (следование промпту)
- **Steps**: 25 (качество генерации)
### 4. Запустите генерацию
Нажмите **"🎬 Generate Video"** и дождитесь завершения.
## ⚙️ Настройки качества
### Быстрая генерация
- Steps: 15
- Audio CFG: 2.5
- Guidance: 6.0
### Высокое качество
- Steps: 40
- Audio CFG: 4.0
- Guidance: 9.0
## 📋 Советы
### 🖼️ Изображения
- Используйте четкие фото с хорошим освещением
- Лицо должно быть хорошо видно
- Разрешение от 512x512 пикселей
### 🎵 Аудио
- Записывайте в тихом помещении
- Избегайте фонового шума
- Говорите четко и разборчиво
### ✏️ Промпты
- "Человек говорит спокойно и уверенно"
- "Эмоциональная речь с активной мимикой"
- "Деловая презентация с жестикуляцией"
## 🎯 Результат
Приложение сгенерирует видео:
- **Разрешение**: 480x720
- **Длительность**: ~3.2 секунды (81 кадр)
- **Синхронизация**: Высокоточная синхронизация губ
- **Качество**: Профессиональное качество видео
## 🔧 Статус интеграции
✅ **Полностью интегрировано**:
- Загрузка моделей из Hugging Face
- Обработка изображений и аудио
- Система конфигурации
- Интерфейс генерации
- Развертывание на HF Spaces
🚀 **Готово к продакшену** с подключением GPU ресурсов! |