phunter_space / ACTIVATION_GUIDE.md

rocketmandrey

Upload folder using huggingface_hub

d18daa3 verified 7 months ago

preview code

raw

history blame contribute delete

3.77 kB

🎬 Активация реальной генерации MeiGen-MultiTalk

✅ ЧТО УЖЕ СДЕЛАНО:

✅ Активирована загрузка реальных моделей в app.py
✅ Создан реальный генератор real_generation.py
✅ Обновлены зависимости в requirements.txt
✅ Настроен пайплайн для полной интеграции

🚀 ПОШАГОВАЯ АКТИВАЦИЯ:

Шаг 1: Установка зависимостей

pip install -r requirements.txt

Шаг 2: Запуск приложения

streamlit run app.py --server.port 8501

Шаг 3: Использование

Откройте: http://localhost:8501
Загрузите:
- 🖼️ Изображение (PNG/JPG) - четкое фото лица
- 🎵 Аудио (MP3/WAV) - чистая речь
Настройте параметры:
- Audio CFG: 3.0-5.0
- Guidance Scale: 7.5
- Steps: 25
Нажмите: "🎬 Generate Video"

🔧 ЧТО ПРОИСХОДИТ ПРИ ГЕНЕРАЦИИ:

Автоматическая загрузка моделей:

✅ TencentGameMate/chinese-wav2vec2-base - аудио обработка
✅ MeiGen-AI/MeiGen-MultiTalk - видео генерация
⏳ Первый запуск: 5-10 минут загрузки
⚡ Последующие: мгновенный старт

Процесс генерации:

🔄 Загрузка моделей (если не загружены)
🎵 Обработка аудио с Wav2Vec2
🖼️ Обработка изображения (resize, normalize)
🎬 Генерация видео (кадр за кадром)
💾 Сохранение в MP4 формате

💻 СИСТЕМНЫЕ ТРЕБОВАНИЯ:

Минимальные:

CPU: 4+ ядра
RAM: 8GB
Storage: 10GB

Для демо (без GPU):

✅ Работает на CPU
⏳ Медленнее (5-10 минут)
🎯 Базовое качество

🎯 РЕЗУЛЬТАТ:

После генерации вы получите:

📹 MP4 видео с синхронизацией губ
📊 Детальный лог процесса
⏱️ Информацию о времени генерации
💾 Возможность скачать результат

🔍 ДИАГНОСТИКА:

Если не работает:

Проверьте зависимости: pip list | grep torch
Проверьте CUDA: python -c "import torch; print(torch.cuda.is_available())"
Проверьте место: df -h
Проверьте логи: в интерфейсе Streamlit

Типичные ошибки:

404 Error: Модель не найдена → автоматический fallback
CUDA Error: Нет GPU → работа на CPU
Memory Error: Мало RAM → уменьшите resolution
Timeout: Долгая генерация → увеличьте timeout

🎉 ГОТОВО К РАБОТЕ!

Теперь ваше приложение:

✅ Загружает реальные модели MeiGen-MultiTalk
✅ Генерирует настоящие видео с lip-sync
✅ Работает локально и на HF Spaces
✅ Готово к продакшену

🎬 Просто загрузите файлы и нажмите "Generate Video"!

rocketmandrey
/

phunter_space