Spaces:

Stylique
/

offline_stores_try_on

Paused

offline_stores_try_on / DatasetGeneration /upperbody_dataset_generation.py

Ali Mohsin

feat: Add virtual try-on system components including DensePose, SMPL, and pix2pixHD models, rendering, and utilities.

5db43ff 11 days ago

5.02 kB

	import numpy as np
	import cv2
	import os
	import sys
	sys.path.append(os.path.abspath(os.path.join(__file__, "..","..")))

	import util.util
	import util.util as util
	import torch
	#from util.video_loader import VideoLoader
	from util.multithread_video_loader import MultithreadVideoLoader
	from util.image_caption import ImageCaption
	import time
	from SMPL.smpl_np_base import SMPLModel
	from SMPL.smpl_regressor import SMPL_Regressor
	from SMPL.pose_filter import PoseFilter, OfflineFilter
	import glm
	from OffscreenRenderer.flat_renderer import FlatRenderer
	from SMPL.amputated_smpl import AmputatedSMPL
	from SMPL.upperbody_smpl.UpperBody import UpperBodySMPL
	from util.image_warp import zoom_in, zoom_out,shift_image_right, shift_image_down,rotate_image
	#from Graphonomy.human_parser import HumanParser
	#from Graphonomy.multiscale_cihp_human_parser import MultiscaleCihpHumanParser
	#from Graphonomy.dataset_settings import dataset_settings
	#cihp_label=dataset_settings['cihp']['label']
	from tqdm import tqdm
	from model.DensePose.densepose_extractor import DensePoseExtractor
	from util.densepose_util import IUV2UpperBodyImg, IUV2TorsoLeg
	#from util.SlideWindowMaskRefine import slide_window_garment_mask_refine
	import json
	from DatasetGeneration.options import BaseOptions
	from util.file_io import get_file_path_list








	def make_video_loader(source_path):
	source_dataset_new = MultithreadVideoLoader(source_path,max_height=3072)
	print("Length of source dataset: %d" % len(source_dataset_new))
	return source_dataset_new




	def gen_dataset(source_path, mask_dir,dataset_name):
	video_loader = make_video_loader(source_path)
	smpl_regressor = SMPL_Regressor(use_bev=True,fix_body=True)
	densepose_extractor = DensePoseExtractor()
	mask_lists= get_file_path_list(mask_dir,'png')
	assert len(mask_lists)==len(video_loader), "Number of masks and video frames are inconsistent!"


	#human_parser = MultiscaleCihpHumanParser()
	upper_body=UpperBodySMPL()
	target_path = os.path.join('./PerGarmentDatasets', dataset_name)
	os.makedirs(target_path, exist_ok=True)
	resolution=1024

	height=None
	width=None

	for i in tqdm(range(len(video_loader))):
	raw_image = video_loader.cap()
	raw_mask_path=mask_lists[i]
	if raw_image is None:
	break
	height = raw_image.shape[0]
	width = raw_image.shape[1]
	new_height = 1024
	new_width = new_height * width // height
	resized_image = cv2.resize(raw_image, (new_width, new_height))

	smpl_param, trans2roi, inv_trans2roi = smpl_regressor.forward(raw_image, True, size=1.45,
	roi_img_size=resolution) # 1.38

	# print(list(smpl_param.keys()))
	if smpl_param is None:
	continue
	vertices = smpl_regressor.get_raw_verts(smpl_param)
	vertices = torch.from_numpy(vertices).unsqueeze(0)

	v = vertices

	raw_vm = upper_body.render(v[0], height=new_height, width=new_width)



	raw_IUV = densepose_extractor.get_IUV(resized_image,isRGB=False)
	if raw_IUV is None:
	continue
	#raw_dp_img = densepose_extractor.IUV2img(raw_IUV)
	#torso_leg_img = IUV2TorsoLeg(raw_IUV)

	raw_mask = cv2.imread(raw_mask_path,cv2.IMREAD_UNCHANGED)[:,:,3]
	raw_mask=cv2.resize(raw_mask,(width,height))



	raw_garment = raw_image.copy()
	raw_garment[raw_mask<127] = 0
	roi_garment_img = cv2.warpAffine(raw_garment, trans2roi, (resolution, resolution),
	flags=cv2.INTER_LINEAR,
	borderMode=cv2.BORDER_CONSTANT,
	borderValue=(0, 0, 0))

	garment_path=os.path.join(target_path,str(i).zfill(5) + '_garment.jpg')
	vm_path=os.path.join(target_path,str(i).zfill(5) + '_vm.jpg')
	mask_path = os.path.join(target_path, str(i).zfill(5) + '_mask.png')
	iuv_path = os.path.join(target_path, str(i).zfill(5) + '_iuv.npy')
	trans2roi_path = os.path.join(target_path, str(i).zfill(5) + '_trans2roi.npy')
	cv2.imwrite(garment_path,roi_garment_img)
	cv2.imwrite(vm_path,raw_vm)
	cv2.imwrite(mask_path,raw_mask)
	np.save(iuv_path, raw_IUV)
	np.save(trans2roi_path, trans2roi)
	dataset_info = {
	"height": height,
	"width": width
	}
	with open(os.path.join(target_path,"dataset_info.json"), "w") as outfile:
	json.dump(dataset_info, outfile)
	video_loader.close()


	def mask2img(mask):
	mask=mask.astype(np.uint8)
	mask=mask*255

	return mask





	def process_video(v_path,mask_dir,dataset_name):
	gen_dataset(v_path, mask_dir,dataset_name)


	if __name__ == '__main__':
	opts = BaseOptions()
	opt = opts.parse()
	video_path = opt.video_path
	mask_dir = opt.mask_dir
	dataset_name = opt.dataset_name
	process_video(video_path, mask_dir,dataset_name=dataset_name)