Upload 96 files

315ffb3 verified 2 days ago

11.5 kB

	"""
	Test script for TAPFormer model on EDS and EC datasets.
	This script evaluates the model performance on test sequences.

	Usage:
	python test_EDS_EC.py [--config config_eds_ec.yaml]
	"""

	import os
	import sys
	import argparse
	import yaml
	import torch
	import time
	import numpy as np

	from LFE_TAP.evaluator.evaluator import compareTracks
	from LFE_TAP.datasets.EDS_dataset import EDS_dataset
	from LFE_TAP.datasets.EC_dataset import EC_dataset
	from LFE_TAP.evaluator.prediction import TAPFormer_online
	from LFE_TAP.evaluator.evaluation_pred import EvaluationPredictor
	from LFE_TAP.utils.visualizer import Visualizer

	# ========== Configuration ==========
	torch.backends.cudnn.deterministic = True
	torch.backends.cudnn.benchmark = False
	DEFAULT_DEVICE = ('cuda' if torch.cuda.is_available() else
	'mps' if torch.backends.mps.is_available() else
	'cpu')

	def load_config(config_path):
	"""Load configuration from YAML file."""
	with open(config_path, 'r', encoding='utf-8') as f:
	config = yaml.safe_load(f)
	return config

	def parse_args():
	"""Parse command line arguments."""
	parser = argparse.ArgumentParser(description='Test TAPFormer model on EDS and EC datasets')
	parser.add_argument('--config', type=str, default='config/config_eds_ec.yaml',
	help='Path to configuration YAML file')
	return parser.parse_args()

	# Parse arguments and load config
	args = parse_args()
	config = load_config(args.config)

	# Extract configuration
	dataset_dir = config['dataset_dir']
	ckpt_root = config['ckpt_root']
	EVAL_DATASETS_EDS = config['eval_datasets_eds']
	EVAL_DATASETS_EC = config['eval_datasets_ec']

	# Model configuration
	model_cfg = config
	representation = model_cfg['representation']
	stride = model_cfg['stride']
	corr_levels = model_cfg['corr_levels']
	backbone = model_cfg['backbone']
	window_size = model_cfg.get('window_size', 16)
	corr_radius = model_cfg.get('corr_radius', 3)
	hidden_size = model_cfg.get('hidden_size', 384)
	space_depth = model_cfg.get('space_depth', 3)
	time_depth = model_cfg.get('time_depth', 3)

	# Evaluation settings
	eds_cfg = config['eds']
	ec_cfg = config['ec']

	# Visualization and output settings
	vis_cfg = config.get('visualization', {})
	output_cfg = config.get('output', {})
	enable_visualization = vis_cfg.get('enable', False)
	save_results = output_cfg.get('save_results', False)
	save_trajectory = output_cfg.get('save_trajectory', False)
	model_name = os.path.basename(os.path.dirname(ckpt_root))

	# ========== Model Initialization ==========
	print("Loading model...")
	model = TAPFormer_online(
	window_size=window_size,
	stride=stride,
	corr_radius=corr_radius,
	corr_levels=corr_levels,
	backbone=backbone,
	hidden_size=hidden_size,
	space_depth=space_depth,
	time_depth=time_depth
	)

	# Load checkpoint
	state_dict = torch.load(ckpt_root, map_location=DEFAULT_DEVICE)
	if "model" in state_dict:
	state_dict = state_dict["model"]
	model.load_state_dict(state_dict, strict=False)
	model.eval()
	print("Model loaded successfully!")

	# ========== Evaluation on EDS Dataset ==========
	print("\n" + "="*50)
	print("Evaluating on EDS dataset...")
	print("="*50)
	fa, efa, t_l = [], [], []
	for seq_name in EVAL_DATASETS_EDS:
	datasets = EDS_dataset(os.path.join(dataset_dir, "eds_subseq"), representation=representation, dt=eds_cfg['dt'])
	sample, gotit = datasets.get_a_seq(seq_name)
	if not gotit:
	continue

	# Setup output directory
	output_dir = os.path.join(output_cfg.get('eds_dir', 'output/eval_eds_subseq'), seq_name, model_name)
	if enable_visualization or save_results or save_trajectory:
	os.makedirs(output_dir, exist_ok=True)

	# Initialize visualizer if needed
	vis = None
	if enable_visualization:
	vis = Visualizer(output_dir, fps=vis_cfg.get('fps', 50))

	grid_size = eds_cfg['grid_size']

	predictor = EvaluationPredictor(
	model,
	grid_size=grid_size,
	local_grid_size=0,
	single_point=False,
	num_uniformly_sampled_pts=0,
	n_iters=eds_cfg['n_iters'],
	if_test=True,
	)

	if torch.cuda.is_available():
	predictor.model = predictor.model.cuda()

	queries = sample.query_points[np.newaxis, ...]
	queries = queries.to(DEFAULT_DEVICE)

	sample.video = sample.video[np.newaxis, ...]
	sample.events = sample.events[np.newaxis, ...]

	start = time.time()
	pred_tracks = predictor(sample.video, sample.events, queries, img_ifnew=sample.img_ifnew)
	elapsed_time = (time.time()-start)/sample.events.shape[1]
	t_l.append(elapsed_time)
	print("time per frame:", elapsed_time)

	# Visualization
	if enable_visualization and vis is not None:
	vis.visualize(
	sample.video if isinstance(sample.video, torch.Tensor) else torch.from_numpy(sample.video).float(),
	sample.events if isinstance(sample.events, torch.Tensor) else torch.from_numpy(sample.events).float(),
	pred_tracks[0],
	pred_tracks[1] > 0.8,
	filename=seq_name,
	video_model="events",
	)

	B, T, N, _ = pred_tracks[0].shape
	ind = np.arange(N).reshape(1, 1, N, 1).repeat(T, axis=1)
	t = sample.segmentation.astype(float)
	t *= 1e-6
	t = t.reshape(1, -1, 1, 1).repeat(N, axis=2)
	pred_trajectory = np.concatenate((ind, t, pred_tracks[0].cpu().numpy()), axis=3)
	pred_trajectory_txt = np.transpose(pred_trajectory, (0, 2, 1, 3)).reshape(-1, 4)

	# Save trajectory if requested
	if save_trajectory:
	traj_path = os.path.join(output_dir, "pred_trajectory.txt")
	np.savetxt(traj_path, pred_trajectory_txt, fmt=["%i", "%.9f", "%.2f", "%.2f"], delimiter=" ")
	print(f"Trajectory saved to {traj_path}")

	traj = sample.trajectory.copy()

	mean_err_avg = []
	for i in range(1, 32):
	error_datas, errors, mean_err = compareTracks(pred_trajectory_txt, traj, i)
	mean_err_avg.append(mean_err)
	mean_err_avg = np.stack(mean_err_avg)
	mean_err_avg = np.mean(mean_err_avg, axis=0)
	print(seq_name, "deep_ev mean error:", mean_err_avg[0], " mean age:", mean_err_avg[1], "expect age:", mean_err_avg[2])
	fa.append(mean_err_avg[1])
	efa.append(mean_err_avg[2])

	# Save results if requested
	if save_results:
	result_path = os.path.join(output_dir, "result.txt")
	with open(result_path, 'w') as f:
	f.write(f"{seq_name} deep_ev mean error: {mean_err_avg[0]} mean age: {mean_err_avg[1]} expect age: {mean_err_avg[2]}\n")
	f.write(f"time per frame: {elapsed_time}\n")
	print(f"Results saved to {result_path}")

	if len(fa) > 0:
	avg_fa = np.array(fa).sum()/len(fa)
	avg_efa = np.array(efa).sum()/len(efa)
	avg_time = np.array(t_l).sum()/len(t_l)
	print("ave fa:", avg_fa, "efa:", avg_efa, "time:", avg_time)

	if len(fa) > 0:
	print(f"\nEDS Dataset Average Results:")
	print(f" Average FA: {np.array(fa).sum()/len(fa):.4f}")
	print(f" Average EFA: {np.array(efa).sum()/len(efa):.4f}")
	print(f" Average Time per Frame: {np.array(t_l).sum()/len(t_l):.4f} seconds")

	# ========== Evaluation on EC Dataset ==========
	print("\n" + "="*50)
	print("Evaluating on EC dataset...")
	print("="*50)
	fa, efa, t_l = [], [], []
	datasets = EC_dataset(os.path.join(dataset_dir, "ec_subseq"), representation=representation,
	event_template_type=ec_cfg['event_template_type'], dt=ec_cfg['dt'])
	for seq_name in EVAL_DATASETS_EC:
	sample, gotit = datasets.get_a_seq(seq_name)
	if not gotit:
	continue

	# Setup output directory
	output_dir = os.path.join(output_cfg.get('ec_dir', 'output/eval_ec_subseq'), seq_name, model_name)
	if enable_visualization or save_results or save_trajectory:
	os.makedirs(output_dir, exist_ok=True)

	# Initialize visualizer if needed
	vis = None
	if enable_visualization:
	vis = Visualizer(output_dir, fps=vis_cfg.get('fps_ec', 10))

	grid_size = ec_cfg['grid_size']

	predictor = EvaluationPredictor(
	model,
	grid_size=grid_size,
	local_grid_size=0,
	single_point=False,
	num_uniformly_sampled_pts=0,
	n_iters=ec_cfg['n_iters'],
	if_test=True,
	)

	if torch.cuda.is_available():
	predictor.model = predictor.model.cuda()

	queries = sample.query_points[np.newaxis, ...]
	queries = queries.to(DEFAULT_DEVICE)

	sample.video = sample.video[np.newaxis, ...]
	sample.events = sample.events[np.newaxis, ...]

	start = time.time()
	pred_tracks = predictor(sample.video, sample.events, queries, img_ifnew=sample.img_ifnew)
	elapsed_time = (time.time()-start)/sample.events.shape[1]
	t_l.append(elapsed_time)

	# Visualization
	if enable_visualization and vis is not None:
	vis.visualize(
	sample.video if isinstance(sample.video, torch.Tensor) else torch.from_numpy(sample.video).float(),
	sample.events if isinstance(sample.events, torch.Tensor) else torch.from_numpy(sample.events).float(),
	pred_tracks[0],
	pred_tracks[1] > 0.8,
	filename=seq_name,
	video_model='events',
	)

	B, T, N, _ = pred_tracks[0].shape
	ind = np.arange(N).reshape(1, 1, N, 1).repeat(T, axis=1)
	t = sample.segmentation.astype(float)
	t *= 1e-6
	t = t.reshape(1, -1, 1, 1).repeat(N, axis=2)
	pred_trajectory = np.concatenate((ind, t, pred_tracks[0].cpu().numpy()), axis=3)
	pred_trajectory_txt = np.transpose(pred_trajectory, (0, 2, 1, 3)).reshape(-1, 4)

	# Save trajectory if requested
	if save_trajectory:
	traj_path = os.path.join(output_dir, "pred_trajectory.txt")
	np.savetxt(traj_path, pred_trajectory_txt, fmt=["%i", "%.9f", "%.2f", "%.2f"], delimiter=" ")
	print(f"Trajectory saved to {traj_path}")

	traj = sample.trajectory.copy()

	mean_err_avg = []
	for i in range(1, 32):
	error_datas, errors, mean_err = compareTracks(pred_trajectory_txt, traj, i)
	mean_err_avg.append(mean_err)
	mean_err_avg = np.stack(mean_err_avg)
	mean_err_avg = np.mean(mean_err_avg, axis=0)
	print(seq_name, "deep_ev mean error:", mean_err_avg[0], " mean age:", mean_err_avg[1], "expect age:", mean_err_avg[2])

	fa.append(mean_err_avg[1])
	efa.append(mean_err_avg[2])

	# Save results if requested
	if save_results:
	result_path = os.path.join(output_dir, "result.txt")
	with open(result_path, 'w') as f:
	f.write(f"{seq_name} deep_ev mean error: {mean_err_avg[0]} mean age: {mean_err_avg[1]} expect age: {mean_err_avg[2]}\n")
	f.write(f"time per frame: {elapsed_time}\n")
	print(f"Results saved to {result_path}")

	if len(fa) > 0:
	avg_fa = np.array(fa).sum()/len(fa)
	avg_efa = np.array(efa).sum()/len(efa)
	avg_time = np.array(t_l).sum()/len(t_l)
	print("ave fa:", avg_fa, "efa:", avg_efa, "time:", avg_time)

	if len(fa) > 0:
	print(f"\nEC Dataset Average Results:")
	print(f" Average FA: {np.array(fa).sum()/len(fa):.4f}")
	print(f" Average EFA: {np.array(efa).sum()/len(efa):.4f}")
	print(f" Average Time per Frame: {np.array(t_l).sum()/len(t_l):.4f} seconds")