phunter_space / USAGE.md
rocketmandrey's picture
Upload USAGE.md with huggingface_hub
a0932ee verified

🎬 Как использовать MeiGen-MultiTalk Demo

🚀 Быстрый старт

1. Откройте приложение

2. Загрузите файлы

  • Изображение: PNG, JPG, JPEG (лицо человека, фронтальный ракурс)
  • Аудио: MP3, WAV, OGG, M4A (чистая речь, 1-15 секунд)

3. Настройте параметры

  • Prompt: Опишите стиль разговора (например: "Человек говорит эмоционально и выразительно")
  • Audio CFG: 3.0-5.0 (точность синхронизации губ)
  • Guidance Scale: 7.5 (следование промпту)
  • Steps: 25 (качество генерации)

4. Запустите генерацию

Нажмите "🎬 Generate Video" и дождитесь завершения.

⚙️ Настройки качества

Быстрая генерация

  • Steps: 15
  • Audio CFG: 2.5
  • Guidance: 6.0

Высокое качество

  • Steps: 40
  • Audio CFG: 4.0
  • Guidance: 9.0

📋 Советы

🖼️ Изображения

  • Используйте четкие фото с хорошим освещением
  • Лицо должно быть хорошо видно
  • Разрешение от 512x512 пикселей

🎵 Аудио

  • Записывайте в тихом помещении
  • Избегайте фонового шума
  • Говорите четко и разборчиво

✏️ Промпты

  • "Человек говорит спокойно и уверенно"
  • "Эмоциональная речь с активной мимикой"
  • "Деловая презентация с жестикуляцией"

🎯 Результат

Приложение сгенерирует видео:

  • Разрешение: 480x720
  • Длительность: ~3.2 секунды (81 кадр)
  • Синхронизация: Высокоточная синхронизация губ
  • Качество: Профессиональное качество видео

🔧 Статус интеграции

Полностью интегрировано:

  • Загрузка моделей из Hugging Face
  • Обработка изображений и аудио
  • Система конфигурации
  • Интерфейс генерации
  • Развертывание на HF Spaces

🚀 Готово к продакшену с подключением GPU ресурсов!