Spaces:

AIDetect-benchmarked
/

Deepfake-Detector

Sleeping

App Files Files Community

Deepfake-Detector / configs /recognition /swin /swin-tiny-p244-w877_in1k-pre_8xb8-amp-genvidbench.py

AZIIIIIIIIZ

Upload 1039 files

d670799 verified 3 months ago

raw

history blame contribute delete

4.27 kB

	_base_ = [
	'../../_base_/models/swin_tiny.py', '../../_base_/default_runtime.py'
	]

	model = dict(
	backbone=dict(
	pretrained= # noqa: E251
	'https://download.openmmlab.com/mmaction/v1.0/recognition/swin/swin_tiny_patch4_window7_224.pth' # noqa: E501
	))

	# dataset settings
	dataset_type = 'VideoDataset'
	data_root = 'data'
	data_root_val = 'data'
	ann_file_train = 'data/GenVidBench/label/fake_real_label/train.txt'
	ann_file_val = 'data/GenVidBench/label/fake_real_label/test.txt'
	ann_file_test = 'data/GenVidBench/label/fake_real_label/test.txt'

	model = dict(cls_head=dict(num_classes=2))

	file_client_args = dict(io_backend='disk')
	train_pipeline = [
	dict(type='DecordInit', **file_client_args),
	dict(type='SampleFrames', clip_len=8, frame_interval=2, num_clips=1),
	dict(type='DecordDecode'),
	dict(type='Resize', scale=(-1, 256)),
	dict(type='RandomResizedCrop'),
	dict(type='Resize', scale=(224, 224), keep_ratio=False),
	dict(type='Flip', flip_ratio=0.5),
	dict(type='FormatShape', input_format='NCTHW'),
	dict(type='PackActionInputs')
	]
	val_pipeline = [
	dict(type='DecordInit', **file_client_args),
	dict(
	type='SampleFrames',
	clip_len=32,
	frame_interval=2,
	num_clips=1,
	test_mode=True),
	dict(type='DecordDecode'),
	dict(type='Resize', scale=(-1, 256)),
	dict(type='CenterCrop', crop_size=224),
	dict(type='FormatShape', input_format='NCTHW'),
	dict(type='PackActionInputs')
	]
	test_pipeline = [
	dict(type='DecordInit', **file_client_args),
	dict(
	type='SampleFrames',
	clip_len=32,
	frame_interval=2,
	num_clips=4,
	test_mode=True),
	dict(type='DecordDecode'),
	dict(type='Resize', scale=(-1, 224)),
	dict(type='ThreeCrop', crop_size=224),
	dict(type='FormatShape', input_format='NCTHW'),
	dict(type='PackActionInputs')
	]

	train_dataloader = dict(
	batch_size=8,
	num_workers=8,
	persistent_workers=True,
	sampler=dict(type='DefaultSampler', shuffle=True),
	dataset=dict(
	type=dataset_type,
	ann_file=ann_file_train,
	data_prefix=dict(video=data_root),
	pipeline=train_pipeline))
	val_dataloader = dict(
	batch_size=8,
	num_workers=8,
	persistent_workers=True,
	sampler=dict(type='DefaultSampler', shuffle=False),
	dataset=dict(
	type=dataset_type,
	ann_file=ann_file_val,
	data_prefix=dict(video=data_root_val),
	pipeline=val_pipeline,
	test_mode=True))
	test_dataloader = dict(
	batch_size=1,
	num_workers=8,
	persistent_workers=True,
	sampler=dict(type='DefaultSampler', shuffle=False),
	dataset=dict(
	type=dataset_type,
	ann_file=ann_file_test,
	data_prefix=dict(video=data_root_val),
	pipeline=test_pipeline,
	test_mode=True))

	val_evaluator = dict(type='AccMetric')
	test_evaluator = val_evaluator

	train_cfg = dict(
	type='EpochBasedTrainLoop', max_epochs=30, val_begin=1, val_interval=3)
	val_cfg = dict(type='ValLoop')
	test_cfg = dict(type='TestLoop')

	optim_wrapper = dict(
	type='AmpOptimWrapper',
	optimizer=dict(
	type='AdamW', lr=1e-3, betas=(0.9, 0.999), weight_decay=0.02),
	constructor='SwinOptimWrapperConstructor',
	paramwise_cfg=dict(
	absolute_pos_embed=dict(decay_mult=0.),
	relative_position_bias_table=dict(decay_mult=0.),
	norm=dict(decay_mult=0.),
	backbone=dict(lr_mult=0.1)))

	param_scheduler = [
	dict(
	type='LinearLR',
	start_factor=0.1,
	by_epoch=True,
	begin=0,
	end=2.5,
	convert_to_iter_based=True),
	dict(
	type='CosineAnnealingLR',
	T_max=30,
	eta_min=0,
	by_epoch=True,
	begin=0,
	end=30)
	]

	default_hooks = dict(
	checkpoint=dict(interval=3, max_keep_ckpts=5), logger=dict(interval=100))

	# Default setting for scaling LR automatically
	# - `enable` means enable scaling LR automatically
	# or not by default.
	# - `base_batch_size` = (8 GPUs) x (8 samples per GPU).
	auto_scale_lr = dict(enable=False, base_batch_size=64)