phunter_space / USAGE.md
rocketmandrey's picture
Upload USAGE.md with huggingface_hub
a0932ee verified
# 🎬 Как использовать MeiGen-MultiTalk Demo
## 🚀 Быстрый старт
### 1. Откройте приложение
- **Локально**: http://localhost:8501
- **Hugging Face**: https://rocketmandrey-phunter-space.hf.space
### 2. Загрузите файлы
- **Изображение**: PNG, JPG, JPEG (лицо человека, фронтальный ракурс)
- **Аудио**: MP3, WAV, OGG, M4A (чистая речь, 1-15 секунд)
### 3. Настройте параметры
- **Prompt**: Опишите стиль разговора (например: "Человек говорит эмоционально и выразительно")
- **Audio CFG**: 3.0-5.0 (точность синхронизации губ)
- **Guidance Scale**: 7.5 (следование промпту)
- **Steps**: 25 (качество генерации)
### 4. Запустите генерацию
Нажмите **"🎬 Generate Video"** и дождитесь завершения.
## ⚙️ Настройки качества
### Быстрая генерация
- Steps: 15
- Audio CFG: 2.5
- Guidance: 6.0
### Высокое качество
- Steps: 40
- Audio CFG: 4.0
- Guidance: 9.0
## 📋 Советы
### 🖼️ Изображения
- Используйте четкие фото с хорошим освещением
- Лицо должно быть хорошо видно
- Разрешение от 512x512 пикселей
### 🎵 Аудио
- Записывайте в тихом помещении
- Избегайте фонового шума
- Говорите четко и разборчиво
### ✏️ Промпты
- "Человек говорит спокойно и уверенно"
- "Эмоциональная речь с активной мимикой"
- "Деловая презентация с жестикуляцией"
## 🎯 Результат
Приложение сгенерирует видео:
- **Разрешение**: 480x720
- **Длительность**: ~3.2 секунды (81 кадр)
- **Синхронизация**: Высокоточная синхронизация губ
- **Качество**: Профессиональное качество видео
## 🔧 Статус интеграции
**Полностью интегрировано**:
- Загрузка моделей из Hugging Face
- Обработка изображений и аудио
- Система конфигурации
- Интерфейс генерации
- Развертывание на HF Spaces
🚀 **Готово к продакшену** с подключением GPU ресурсов!