shunliwang

update

8bc3305 about 1 month ago

12.4 kB

	# author: Zhiyuan Yan
	# email: zhiyuanyan@link.cuhk.edu.cn
	# date: 2023-03-30
	# description: training code.

	import os
	import argparse
	from os.path import join
	import cv2
	import random
	import datetime
	import time
	import yaml
	from tqdm import tqdm
	import numpy as np
	from datetime import timedelta
	from copy import deepcopy
	from PIL import Image as pil_image

	import torch
	import torch.nn as nn
	import torch.nn.parallel
	import torch.backends.cudnn as cudnn
	import torch.utils.data
	import torch.optim as optim
	from torch.utils.data.distributed import DistributedSampler
	import torch.distributed as dist

	from optimizor.SAM import SAM
	from optimizor.LinearLR import LinearDecayLR

	from trainer.trainer import Trainer
	from detectors import DETECTOR
	from dataset import *
	from metrics.utils import parse_metric_for_print
	from logger import create_logger

	# torch.hub.set_dir("training/pretrained")

	parser = argparse.ArgumentParser(description='Process some paths.')
	parser.add_argument('--detector_path', type=str,
	default='/data/home/zhiyuanyan/DeepfakeBenchv2/training/config/detector/sbi.yaml',
	help='path to detector YAML file')
	parser.add_argument("--train_dataset", nargs="+")
	parser.add_argument("--test_dataset", nargs="+")
	parser.add_argument('--no-save_ckpt', dest='save_ckpt', action='store_false', default=True)
	parser.add_argument('--no-save_feat', dest='save_feat', action='store_false', default=True)
	parser.add_argument("--ddp", action='store_true', default=False)
	parser.add_argument('--local_rank', '--local-rank', type=int, default=0)
	parser.add_argument('--task_target', type=str, default="", help='specify the target of current training task')
	args = parser.parse_args()
	torch.cuda.set_device(args.local_rank)


	def init_seed(config):
	if config['manualSeed'] is None:
	config['manualSeed'] = random.randint(1, 10000)
	random.seed(config['manualSeed'])
	if config['cuda']:
	torch.manual_seed(config['manualSeed'])
	torch.cuda.manual_seed_all(config['manualSeed'])


	def prepare_training_data(config):
	#### Prepare Dataset
	# Only use the blending dataset class in training
	if 'dataset_type' in config and config['dataset_type'] == 'blend':
	if config['model_name'] == 'facexray':
	train_set = FFBlendDataset(config)
	elif config['model_name'] == 'fwa':
	train_set = FWABlendDataset(config)
	elif config['model_name'] == 'sbi':
	train_set = SBIDataset(config, mode='train')
	elif config['model_name'] == 'lsda':
	train_set = LSDADataset(config, mode='train')
	else:
	raise NotImplementedError('Only facexray, fwa, sbi, and lsda are currently supported for blending dataset')
	elif 'dataset_type' in config and config['dataset_type'] == 'pair':
	train_set = pairDataset(config, mode='train') # Only use the pair dataset class in training
	elif 'dataset_type' in config and config['dataset_type'] == 'iid':
	train_set = IIDDataset(config, mode='train')
	elif 'dataset_type' in config and config['dataset_type'] == 'I2G':
	train_set = I2GDataset(config, mode='train')
	elif 'dataset_type' in config and config['dataset_type'] == 'lrl':
	train_set = LRLDataset(config, mode='train')
	else:
	train_set = DeepfakeAbstractBaseDataset(config=config, mode='train')

	#### Prepare DataLoader
	# Use a customized `CustomSampler` when the model is LSDA
	if config['model_name'] == 'lsda':
	from dataset.lsda_dataset import CustomSampler
	custom_sampler = CustomSampler(num_groups=2*360, n_frame_per_vid=config['frame_num']['train'], batch_size=config['train_batchSize'], videos_per_group=5)
	train_data_loader = \
	torch.utils.data.DataLoader(
	dataset=train_set,
	batch_size=config['train_batchSize'],
	num_workers=int(config['workers']),
	sampler=custom_sampler,
	collate_fn=train_set.collate_fn,
	pin_memory=True
	)
	# Configure a distributed sampler when DDP is enabled
	elif config['ddp']:
	sampler = DistributedSampler(train_set)
	train_data_loader = \
	torch.utils.data.DataLoader(
	dataset=train_set,
	batch_size=config['train_batchSize'],
	num_workers=int(config['workers']),
	collate_fn=train_set.collate_fn,
	sampler=sampler,
	pin_memory=True
	)
	# Otherwise use the standard sampler
	else:

	train_data_loader = \
	torch.utils.data.DataLoader(
	dataset=train_set,
	batch_size=config['train_batchSize'],
	shuffle=True,
	num_workers=int(config['workers']),
	collate_fn=train_set.collate_fn,
	pin_memory=True
	)

	return train_data_loader


	def prepare_testing_data(config):
	def get_test_data_loader(config, test_name):
	# update the config dictionary with the specific testing dataset
	config = config.copy() # create a copy of config to avoid altering the original one
	config['test_dataset'] = test_name # specify the current test dataset
	if not config.get('dataset_type', None) == 'lrl':
	test_set = DeepfakeAbstractBaseDataset(
	config=config,
	mode='test',
	)
	else:
	test_set = LRLDataset(
	config=config,
	mode='test',
	)

	test_data_loader = \
	torch.utils.data.DataLoader(
	dataset=test_set,
	batch_size=config['test_batchSize'],
	shuffle=False,
	num_workers=int(config['workers']),
	collate_fn=test_set.collate_fn,
	drop_last=False,
	pin_memory=True
	)

	return test_data_loader

	test_data_loaders = {}
	for one_test_name in config['test_dataset']:
	test_data_loaders[one_test_name] = get_test_data_loader(config, one_test_name)
	return test_data_loaders


	def choose_optimizer(model, config):
	opt_name = config['optimizer']['type']
	if opt_name == 'sgd':
	optimizer = optim.SGD(
	params=model.parameters(),
	lr=config['optimizer'][opt_name]['lr'],
	momentum=config['optimizer'][opt_name]['momentum'],
	weight_decay=config['optimizer'][opt_name]['weight_decay']
	)
	return optimizer
	elif opt_name == 'adam':
	optimizer = optim.Adam(
	params=model.parameters(),
	lr=config['optimizer'][opt_name]['lr'],
	weight_decay=config['optimizer'][opt_name]['weight_decay'],
	betas=(config['optimizer'][opt_name]['beta1'], config['optimizer'][opt_name]['beta2']),
	eps=config['optimizer'][opt_name]['eps'],
	amsgrad=config['optimizer'][opt_name]['amsgrad'],
	)
	return optimizer
	elif opt_name == 'sam':
	optimizer = SAM(
	model.parameters(),
	optim.SGD,
	lr=config['optimizer'][opt_name]['lr'],
	momentum=config['optimizer'][opt_name]['momentum'],
	)
	else:
	raise NotImplementedError('Optimizer {} is not implemented'.format(config['optimizer']))
	return optimizer


	def choose_scheduler(config, optimizer):
	if config['lr_scheduler'] is None:
	return None
	elif config['lr_scheduler'] == 'step':
	scheduler = optim.lr_scheduler.StepLR(
	optimizer,
	step_size=config['lr_step'],
	gamma=config['lr_gamma'],
	)
	return scheduler
	elif config['lr_scheduler'] == 'cosine':
	scheduler = optim.lr_scheduler.CosineAnnealingLR(
	optimizer,
	T_max=config['lr_T_max'],
	eta_min=config['lr_eta_min'],
	)
	return scheduler
	elif config['lr_scheduler'] == 'linear':
	scheduler = LinearDecayLR(
	optimizer,
	config['nEpochs'],
	int(config['nEpochs']/4),
	)
	else:
	raise NotImplementedError('Scheduler {} is not implemented'.format(config['lr_scheduler']))


	def choose_metric(config):
	metric_scoring = config['metric_scoring']
	if metric_scoring not in ['eer', 'auc', 'acc', 'ap']:
	raise NotImplementedError('metric {} is not implemented'.format(metric_scoring))
	return metric_scoring


	def main():
	# parse options and load config

	# Model-specific configuration
	with open(args.detector_path, 'r') as f:
	config = yaml.safe_load(f)
	# Unified base configuration
	with open('./training/config/train_config_p2.yaml', 'r') as f:
	config_base = yaml.safe_load(f)

	# Label dictionary shared by all datasets
	if 'label_dict' in config:
	config_base['label_dict']=config['label_dict'] # The base configuration has the highest priority

	config.update(config_base)

	config['local_rank']=args.local_rank
	if config['dry_run']:
	config['nEpochs'] = 0
	config['save_feat']=False

	# If arguments are provided, they will overwrite the yaml settings
	if args.train_dataset:
	config['train_dataset'] = args.train_dataset
	if args.test_dataset:
	config['test_dataset'] = args.test_dataset
	config['save_ckpt'] = args.save_ckpt
	config['save_feat'] = args.save_feat
	if config['lmdb']:
	config['dataset_json_folder'] = 'preprocessing/dataset_json' # dataset_json_v3

	# init seed
	init_seed(config)

	# set cudnn benchmark if needed
	if config['cudnn']:
	cudnn.benchmark = True
	config['ddp']= args.ddp
	if config['ddp']:
	# dist.init_process_group(backend='gloo')
	dist.init_process_group(backend='nccl', timeout=timedelta(minutes=30))

	# create logger
	timenow=datetime.datetime.now().strftime('%Y-%m-%d-%H-%M-%S')
	task_str = f"_{config['task_target']}" if config.get('task_target', None) is not None else ""
	logger_path = os.path.join(
	config['log_dir'],
	config['model_name'] + task_str + '_' + timenow
	)
	os.makedirs(logger_path, exist_ok=True)
	logger = create_logger(os.path.join(logger_path, 'training.log'))
	logger.info('Save log to {}'.format(logger_path))

	# print configuration
	logger.info("--------------- Configuration ---------------")
	params_string = "Parameters: \n"
	for key, value in config.items():
	params_string += "{}: {}".format(key, value) + "\n"
	logger.info(params_string)

	# prepare the training data loader
	train_data_loader = prepare_training_data(config)

	# prepare the testing data loader
	test_data_loaders = prepare_testing_data(config)

	# prepare the model (detector)
	model_class = DETECTOR[config['model_name']]
	model = model_class(config)

	print(model)

	# prepare the optimizer
	optimizer = choose_optimizer(model, config)

	# prepare the scheduler
	scheduler = choose_scheduler(config, optimizer)

	# prepare the metric
	metric_scoring = choose_metric(config)

	# prepare the trainer
	trainer = Trainer(config, model, optimizer, scheduler, logger, metric_scoring, time_now=timenow)

	# start training
	for epoch in range(config['start_epoch'], config['nEpochs'] + 1):
	trainer.model.epoch = epoch
	if config['ddp']:
	train_data_loader.sampler.set_epoch(epoch)
	best_metric = trainer.train_epoch(
	epoch=epoch,
	train_data_loader=train_data_loader,
	test_data_loaders=test_data_loaders,
	)
	if best_metric is not None:
	logger.info(f"===> Epoch[{epoch}] end with testing {metric_scoring}: {parse_metric_for_print(best_metric)}!")
	logger.info("Stop Training on best Testing metric {}".format(parse_metric_for_print(best_metric)))

	# update
	if 'svdd' in config['model_name']:
	model.update_R(epoch)
	if scheduler is not None:
	scheduler.step()

	# close the tensorboard writers
	for writer in trainer.writers.values():
	writer.close()


	if __name__ == '__main__':
	main()