Spaces:
Runtime error
Runtime error
update
Browse files
app.py
CHANGED
|
@@ -16,6 +16,8 @@ subprocess.check_call([sys.executable, "-m", "pip", "install", "scikit-image==0.
|
|
| 16 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "face-alignment==1.3.5"])
|
| 17 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "PyYAML==5.3.1"])
|
| 18 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "imageio-ffmpeg==0.4.5"])
|
|
|
|
|
|
|
| 19 |
|
| 20 |
# Cài đặt ffmpeg trong môi trường Ubuntu
|
| 21 |
os.system("apt-get update && apt-get install -y ffmpeg")
|
|
@@ -93,23 +95,77 @@ def normalize_kp(kp_source, kp_driving, kp_driving_initial,
|
|
| 93 |
# Import hàm load_checkpoints từ file helper
|
| 94 |
from load_helper import load_checkpoints, normalize_kp
|
| 95 |
|
| 96 |
-
# Tải mô hình pre-trained
|
| 97 |
def download_model():
|
| 98 |
-
|
| 99 |
-
|
| 100 |
-
|
| 101 |
-
|
| 102 |
-
|
| 103 |
-
|
| 104 |
-
|
| 105 |
-
|
| 106 |
-
|
| 107 |
-
|
| 108 |
-
|
| 109 |
-
|
| 110 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 111 |
|
| 112 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 113 |
|
| 114 |
# Hàm tạo animation
|
| 115 |
def make_animation(source_image, driving_video, relative=True, adapt_movement_scale=True):
|
|
@@ -167,7 +223,7 @@ def make_animation(source_image, driving_video, relative=True, adapt_movement_sc
|
|
| 167 |
predictions.append(np.transpose(out['prediction'].data.cpu().numpy(), [0, 2, 3, 1])[0])
|
| 168 |
|
| 169 |
# Lưu video kết quả
|
| 170 |
-
output_path = '
|
| 171 |
if os.path.exists(output_path):
|
| 172 |
os.remove(output_path) # Xóa video nếu tồn tại
|
| 173 |
|
|
@@ -179,33 +235,41 @@ def make_animation(source_image, driving_video, relative=True, adapt_movement_sc
|
|
| 179 |
|
| 180 |
# Định nghĩa giao diện Gradio
|
| 181 |
def animate_fomm(source_image, driving_video_file, relative=True, adapt_scale=True):
|
| 182 |
-
if source_image is None
|
| 183 |
-
return None, "Vui lòng tải lên
|
| 184 |
|
| 185 |
try:
|
| 186 |
# Lưu tạm ảnh nguồn
|
| 187 |
-
source_path = "
|
| 188 |
source_image.save(source_path)
|
| 189 |
|
| 190 |
-
# Xử lý video tham chiếu
|
| 191 |
print(f"Type of driving_video: {type(driving_video_file)}")
|
| 192 |
|
| 193 |
# Tạo file tạm cho video
|
| 194 |
-
driving_path = "
|
| 195 |
|
| 196 |
-
# Kiểm tra
|
| 197 |
-
if
|
| 198 |
-
#
|
| 199 |
-
|
| 200 |
-
|
| 201 |
-
|
| 202 |
-
|
| 203 |
-
|
| 204 |
-
os.system("wget -O driving_video.mp4 https://github.com/AliaksandrSiarohin/first-order-model/raw/master/driving.mp4")
|
| 205 |
else:
|
| 206 |
-
#
|
| 207 |
-
|
| 208 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 209 |
|
| 210 |
# Tạo animation
|
| 211 |
result_path = make_animation(
|
|
@@ -215,6 +279,13 @@ def animate_fomm(source_image, driving_video_file, relative=True, adapt_scale=Tr
|
|
| 215 |
adapt_movement_scale=adapt_scale
|
| 216 |
)
|
| 217 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 218 |
return result_path, "Video được tạo thành công!"
|
| 219 |
except Exception as e:
|
| 220 |
import traceback
|
|
@@ -229,16 +300,16 @@ with gr.Blocks(title="First Order Motion Model - Tạo video người chuyển
|
|
| 229 |
with gr.Column():
|
| 230 |
source_image = gr.Image(type="pil", label="Tải lên ảnh nguồn")
|
| 231 |
|
|
|
|
|
|
|
|
|
|
| 232 |
# Thay đổi từ gr.Video sang gr.File để xử lý lỗi binary
|
| 233 |
-
driving_video_file = gr.File(label="Tải lên video tham chiếu (.mp4)")
|
| 234 |
|
| 235 |
with gr.Row():
|
| 236 |
relative = gr.Checkbox(value=True, label="Chuyển động tương đối")
|
| 237 |
adapt_scale = gr.Checkbox(value=True, label="Điều chỉnh tỷ lệ chuyển động")
|
| 238 |
|
| 239 |
-
# Thêm tùy chọn sử dụng video mẫu
|
| 240 |
-
use_sample = gr.Checkbox(label="Sử dụng video mẫu (nếu bạn không muốn tải lên video)")
|
| 241 |
-
|
| 242 |
submit_btn = gr.Button("Tạo video")
|
| 243 |
|
| 244 |
with gr.Column():
|
|
@@ -247,36 +318,32 @@ with gr.Blocks(title="First Order Motion Model - Tạo video người chuyển
|
|
| 247 |
|
| 248 |
# Xử lý sự kiện khi checkbox được chọn
|
| 249 |
def toggle_video_upload(use_sample_video):
|
| 250 |
-
return gr.update(
|
| 251 |
|
| 252 |
use_sample.change(fn=toggle_video_upload, inputs=[use_sample], outputs=[driving_video_file])
|
| 253 |
|
| 254 |
# Cập nhật hàm xử lý khi nhấn nút
|
| 255 |
-
def process_inputs(source_img,
|
| 256 |
if use_sample_vid:
|
| 257 |
-
|
| 258 |
-
sample_path = "sample_driving.mp4"
|
| 259 |
-
if not os.path.exists(sample_path):
|
| 260 |
-
os.system("wget -O sample_driving.mp4 https://github.com/AliaksandrSiarohin/first-order-model/raw/master/driving.mp4")
|
| 261 |
-
return animate_fomm(source_img, sample_path, rel, adapt)
|
| 262 |
else:
|
| 263 |
return animate_fomm(source_img, driving_vid, rel, adapt)
|
| 264 |
|
| 265 |
submit_btn.click(
|
| 266 |
fn=process_inputs,
|
| 267 |
-
inputs=[source_image,
|
| 268 |
outputs=[output_video, output_message]
|
| 269 |
)
|
| 270 |
|
| 271 |
gr.Markdown("### Cách sử dụng")
|
| 272 |
gr.Markdown("1. Tải lên **ảnh nguồn** - ảnh chứa người/đối tượng bạn muốn làm chuyển động")
|
| 273 |
-
gr.Markdown("2.
|
| 274 |
-
gr.Markdown("3.
|
| 275 |
-
gr.Markdown("4. Nhấn **Tạo video** và chờ kết quả")
|
| 276 |
|
| 277 |
gr.Markdown("### Lưu ý")
|
| 278 |
gr.Markdown("- Ảnh nguồn và video tham chiếu nên có đối tượng tương tự (người với người, mặt với mặt)")
|
| 279 |
gr.Markdown("- Đối tượng nên ở vị trí tương tự trong cả ảnh nguồn và khung đầu tiên của video tham chiếu")
|
| 280 |
gr.Markdown("- Quá trình tạo video có thể mất vài phút")
|
|
|
|
| 281 |
|
| 282 |
demo.launch()
|
|
|
|
| 16 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "face-alignment==1.3.5"])
|
| 17 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "PyYAML==5.3.1"])
|
| 18 |
subprocess.check_call([sys.executable, "-m", "pip", "install", "imageio-ffmpeg==0.4.5"])
|
| 19 |
+
subprocess.check_call([sys.executable, "-m", "pip", "install", "gdown"])
|
| 20 |
+
subprocess.check_call([sys.executable, "-m", "pip", "install", "huggingface_hub"])
|
| 21 |
|
| 22 |
# Cài đặt ffmpeg trong môi trường Ubuntu
|
| 23 |
os.system("apt-get update && apt-get install -y ffmpeg")
|
|
|
|
| 95 |
# Import hàm load_checkpoints từ file helper
|
| 96 |
from load_helper import load_checkpoints, normalize_kp
|
| 97 |
|
| 98 |
+
# Tải mô hình pre-trained với phương pháp cải tiến
|
| 99 |
def download_model():
|
| 100 |
+
try:
|
| 101 |
+
# Thử phương pháp sử dụng gdown trước
|
| 102 |
+
model_path = 'checkpoints/vox-cpk.pth.tar'
|
| 103 |
+
if not os.path.exists('checkpoints'):
|
| 104 |
+
os.makedirs('checkpoints', exist_ok=True)
|
| 105 |
+
|
| 106 |
+
# Kiểm tra xem file đã tồn tại và đủ lớn chưa
|
| 107 |
+
if not os.path.exists(model_path) or os.path.getsize(model_path) < 1000000:
|
| 108 |
+
print("Đang tải mô hình từ Google Drive...")
|
| 109 |
+
import gdown
|
| 110 |
+
file_id = '1PyQJmkdCsAkOYwUyaj_l-l0as-iLDgeH'
|
| 111 |
+
gdown.download(f"https://drive.google.com/uc?id={file_id}", model_path, quiet=False)
|
| 112 |
+
|
| 113 |
+
config_path = 'first_order_model/config/vox-256.yaml'
|
| 114 |
+
if not os.path.exists('first_order_model/config'):
|
| 115 |
+
os.makedirs('first_order_model/config', exist_ok=True)
|
| 116 |
+
|
| 117 |
+
if not os.path.exists(config_path) or os.path.getsize(config_path) < 1000:
|
| 118 |
+
print("Đang tải file cấu hình từ Google Drive...")
|
| 119 |
+
import gdown
|
| 120 |
+
file_id = '1pZUMNRjkBiuBEM68oj9nskuWgJR-5QMn'
|
| 121 |
+
gdown.download(f"https://drive.google.com/uc?id={file_id}", config_path, quiet=False)
|
| 122 |
+
|
| 123 |
+
# Kiểm tra lại kích thước file
|
| 124 |
+
if os.path.exists(model_path) and os.path.getsize(model_path) > 1000000 and os.path.exists(config_path) and os.path.getsize(config_path) > 1000:
|
| 125 |
+
return config_path, model_path
|
| 126 |
+
|
| 127 |
+
# Nếu gdown không thành công, thử phương pháp sử dụng Hugging Face
|
| 128 |
+
raise Exception("Tải mô hình từ Google Drive không thành công. Chuyển sang sử dụng Hugging Face...")
|
| 129 |
|
| 130 |
+
except Exception as e:
|
| 131 |
+
print(f"Lỗi khi tải từ Google Drive: {str(e)}")
|
| 132 |
+
return download_model_alternative()
|
| 133 |
+
|
| 134 |
+
def download_model_alternative():
|
| 135 |
+
try:
|
| 136 |
+
print("Đang tải mô hình từ Hugging Face...")
|
| 137 |
+
from huggingface_hub import hf_hub_download
|
| 138 |
+
|
| 139 |
+
model_path = hf_hub_download(
|
| 140 |
+
repo_id="ycyunwei/first-order-motion-model",
|
| 141 |
+
filename="vox-cpk.pth.tar"
|
| 142 |
+
)
|
| 143 |
+
|
| 144 |
+
config_path = hf_hub_download(
|
| 145 |
+
repo_id="ycyunwei/first-order-motion-model",
|
| 146 |
+
filename="vox-256.yaml"
|
| 147 |
+
)
|
| 148 |
+
|
| 149 |
+
return config_path, model_path
|
| 150 |
+
except Exception as e:
|
| 151 |
+
print(f"Lỗi khi tải từ Hugging Face: {str(e)}")
|
| 152 |
+
# Thử phương pháp cuối cùng - sử dụng direct link
|
| 153 |
+
model_path = 'checkpoints/vox-cpk.pth.tar'
|
| 154 |
+
if not os.path.exists('checkpoints'):
|
| 155 |
+
os.makedirs('checkpoints', exist_ok=True)
|
| 156 |
+
|
| 157 |
+
os.system(f'wget -O {model_path} https://github.com/AliaksandrSiarohin/first-order-model/releases/download/v1.0.0/vox-cpk.pth.tar')
|
| 158 |
+
|
| 159 |
+
config_path = 'first_order_model/config/vox-256.yaml'
|
| 160 |
+
if not os.path.exists('first_order_model/config'):
|
| 161 |
+
os.makedirs('first_order_model/config', exist_ok=True)
|
| 162 |
+
|
| 163 |
+
os.system(f'wget -O {config_path} https://raw.githubusercontent.com/AliaksandrSiarohin/first-order-model/master/config/vox-256.yaml')
|
| 164 |
+
|
| 165 |
+
if os.path.exists(model_path) and os.path.getsize(model_path) > 1000000 and os.path.exists(config_path) and os.path.getsize(config_path) > 1000:
|
| 166 |
+
return config_path, model_path
|
| 167 |
+
else:
|
| 168 |
+
raise Exception("Không thể tải mô hình b���ng cả ba phương pháp. Vui lòng thử lại sau.")
|
| 169 |
|
| 170 |
# Hàm tạo animation
|
| 171 |
def make_animation(source_image, driving_video, relative=True, adapt_movement_scale=True):
|
|
|
|
| 223 |
predictions.append(np.transpose(out['prediction'].data.cpu().numpy(), [0, 2, 3, 1])[0])
|
| 224 |
|
| 225 |
# Lưu video kết quả
|
| 226 |
+
output_path = f'result_{int(np.random.rand() * 10000)}.mp4'
|
| 227 |
if os.path.exists(output_path):
|
| 228 |
os.remove(output_path) # Xóa video nếu tồn tại
|
| 229 |
|
|
|
|
| 235 |
|
| 236 |
# Định nghĩa giao diện Gradio
|
| 237 |
def animate_fomm(source_image, driving_video_file, relative=True, adapt_scale=True):
|
| 238 |
+
if source_image is None:
|
| 239 |
+
return None, "Vui lòng tải lên ảnh nguồn."
|
| 240 |
|
| 241 |
try:
|
| 242 |
# Lưu tạm ảnh nguồn
|
| 243 |
+
source_path = f"source_image_{int(np.random.rand() * 10000)}.jpg"
|
| 244 |
source_image.save(source_path)
|
| 245 |
|
| 246 |
+
# Xử lý video tham chiếu
|
| 247 |
print(f"Type of driving_video: {type(driving_video_file)}")
|
| 248 |
|
| 249 |
# Tạo file tạm cho video
|
| 250 |
+
driving_path = f"driving_video_{int(np.random.rand() * 10000)}.mp4"
|
| 251 |
|
| 252 |
+
# Kiểm tra nếu đã chọn sử dụng video mẫu
|
| 253 |
+
if driving_video_file is None:
|
| 254 |
+
# Tải và sử dụng video mẫu
|
| 255 |
+
sample_path = "sample_driving.mp4"
|
| 256 |
+
if not os.path.exists(sample_path) or os.path.getsize(sample_path) < 10000:
|
| 257 |
+
print("Đang tải video mẫu...")
|
| 258 |
+
os.system("wget -O sample_driving.mp4 https://github.com/AliaksandrSiarohin/first-order-model/raw/master/driving.mp4")
|
| 259 |
+
driving_path = sample_path
|
|
|
|
| 260 |
else:
|
| 261 |
+
# Xử lý video được tải lên
|
| 262 |
+
if isinstance(driving_video_file, str):
|
| 263 |
+
# Nếu là đường dẫn, copy file
|
| 264 |
+
if os.path.exists(driving_video_file):
|
| 265 |
+
import shutil
|
| 266 |
+
shutil.copyfile(driving_video_file, driving_path)
|
| 267 |
+
else:
|
| 268 |
+
return None, f"Không tìm thấy file video tại đường dẫn: {driving_video_file}"
|
| 269 |
+
else:
|
| 270 |
+
# Ghi dữ liệu nhị phân vào file
|
| 271 |
+
with open(driving_path, 'wb') as f:
|
| 272 |
+
f.write(driving_video_file)
|
| 273 |
|
| 274 |
# Tạo animation
|
| 275 |
result_path = make_animation(
|
|
|
|
| 279 |
adapt_movement_scale=adapt_scale
|
| 280 |
)
|
| 281 |
|
| 282 |
+
# Xóa file tạm nếu cần
|
| 283 |
+
if os.path.exists(source_path) and source_path != "source_image.jpg":
|
| 284 |
+
os.remove(source_path)
|
| 285 |
+
|
| 286 |
+
if os.path.exists(driving_path) and driving_path != "sample_driving.mp4" and driving_path != "driving_video.mp4":
|
| 287 |
+
os.remove(driving_path)
|
| 288 |
+
|
| 289 |
return result_path, "Video được tạo thành công!"
|
| 290 |
except Exception as e:
|
| 291 |
import traceback
|
|
|
|
| 300 |
with gr.Column():
|
| 301 |
source_image = gr.Image(type="pil", label="Tải lên ảnh nguồn")
|
| 302 |
|
| 303 |
+
# Thêm tùy chọn sử dụng video mẫu
|
| 304 |
+
use_sample = gr.Checkbox(label="Sử dụng video mẫu có sẵn", value=True)
|
| 305 |
+
|
| 306 |
# Thay đổi từ gr.Video sang gr.File để xử lý lỗi binary
|
| 307 |
+
driving_video_file = gr.File(label="Tải lên video tham chiếu (.mp4)", visible=False)
|
| 308 |
|
| 309 |
with gr.Row():
|
| 310 |
relative = gr.Checkbox(value=True, label="Chuyển động tương đối")
|
| 311 |
adapt_scale = gr.Checkbox(value=True, label="Điều chỉnh tỷ lệ chuyển động")
|
| 312 |
|
|
|
|
|
|
|
|
|
|
| 313 |
submit_btn = gr.Button("Tạo video")
|
| 314 |
|
| 315 |
with gr.Column():
|
|
|
|
| 318 |
|
| 319 |
# Xử lý sự kiện khi checkbox được chọn
|
| 320 |
def toggle_video_upload(use_sample_video):
|
| 321 |
+
return gr.update(visible=not use_sample_video)
|
| 322 |
|
| 323 |
use_sample.change(fn=toggle_video_upload, inputs=[use_sample], outputs=[driving_video_file])
|
| 324 |
|
| 325 |
# Cập nhật hàm xử lý khi nhấn nút
|
| 326 |
+
def process_inputs(source_img, use_sample_vid, driving_vid, rel, adapt):
|
| 327 |
if use_sample_vid:
|
| 328 |
+
return animate_fomm(source_img, None, rel, adapt)
|
|
|
|
|
|
|
|
|
|
|
|
|
| 329 |
else:
|
| 330 |
return animate_fomm(source_img, driving_vid, rel, adapt)
|
| 331 |
|
| 332 |
submit_btn.click(
|
| 333 |
fn=process_inputs,
|
| 334 |
+
inputs=[source_image, use_sample, driving_video_file, relative, adapt_scale],
|
| 335 |
outputs=[output_video, output_message]
|
| 336 |
)
|
| 337 |
|
| 338 |
gr.Markdown("### Cách sử dụng")
|
| 339 |
gr.Markdown("1. Tải lên **ảnh nguồn** - ảnh chứa người/đối tượng bạn muốn làm chuyển động")
|
| 340 |
+
gr.Markdown("2. Chọn sử dụng video mẫu có sẵn hoặc tải lên video tham chiếu của riêng bạn")
|
| 341 |
+
gr.Markdown("3. Nhấn **Tạo video** và chờ kết quả")
|
|
|
|
| 342 |
|
| 343 |
gr.Markdown("### Lưu ý")
|
| 344 |
gr.Markdown("- Ảnh nguồn và video tham chiếu nên có đối tượng tương tự (người với người, mặt với mặt)")
|
| 345 |
gr.Markdown("- Đối tượng nên ở vị trí tương tự trong cả ảnh nguồn và khung đầu tiên của video tham chiếu")
|
| 346 |
gr.Markdown("- Quá trình tạo video có thể mất vài phút")
|
| 347 |
+
gr.Markdown("- Nếu gặp vấn đề với việc tải lên video, hãy sử dụng video mẫu có sẵn")
|
| 348 |
|
| 349 |
demo.launch()
|