SRPose / model /pl_trainer.py

Upload 53 files

e170a8e verified over 1 year ago

8.01 kB

	from typing import Any
	import numpy as np
	import torch
	import lightning as L
	from lightglue import SuperPoint, DISK, SIFT, ALIKED
	import time

	from utils import rotation_angular_error, translation_angular_error, error_auc
	from .relpose import RelPose


	keypoint_dict = {
	'superpoint': SuperPoint,
	'disk': DISK,
	'sift': SIFT,
	'aliked': ALIKED,
	}


	class PL_RelPose(L.LightningModule):
	def __init__(
	self,
	task,
	lr,
	epochs,
	pct_start,
	num_keypoints,
	n_layers,
	num_heads,
	features='superpoint',
	):
	super().__init__()

	self.extractor = keypoint_dict[features](max_num_keypoints=num_keypoints, detection_threshold=0.0).eval()
	self.module = RelPose(features=features, task=task, n_layers=n_layers, num_heads=num_heads)
	self.criterion = torch.nn.HuberLoss()

	self.s_r = torch.nn.Parameter(torch.zeros(1))
	# self.s_ta = torch.nn.Parameter(torch. zeros(1))
	self.s_t = torch.nn.Parameter(torch.zeros(1))

	self.r_errors = {k:[] for k in ['train', 'valid', 'test']}
	self.ta_errors = {k:[] for k in ['train', 'valid', 'test']}
	self.t_errors = {k:[] for k in ['train', 'valid', 'test']}

	self.save_hyperparameters()

	def _shared_log(self, mode, loss, loss_r, loss_t, loss_ta, loss_tn):
	self.log_dict({
	f'{mode}_loss/sum': loss,
	f'{mode}_loss/r': loss_r,
	f'{mode}_loss/t': loss_t,
	f'{mode}_loss/ta': loss_ta,
	f'{mode}_loss/tn': loss_tn,
	}, on_epoch=True, sync_dist=True)

	def training_step(self, batch, batch_idx):
	loss, loss_r, loss_ta, loss_t, loss_tn, r_err, ta_err, t_err = self._shared_forward_step(batch, batch_idx)

	self.r_errors['train'].append(r_err)
	self.ta_errors['train'].append(ta_err)
	self.t_errors['train'].append(t_err)

	self._shared_log('train', loss, loss_r, loss_t, loss_ta, loss_tn)

	return loss

	def validation_step(self, batch, batch_idx):
	loss, loss_r, loss_ta, loss_t, loss_tn, r_err, ta_err, t_err = self._shared_forward_step(batch, batch_idx)

	self.r_errors['valid'].append(r_err)
	self.ta_errors['valid'].append(ta_err)
	self.t_errors['valid'].append(t_err)

	self._shared_log('valid', loss, loss_r, loss_t, loss_ta, loss_tn)

	def test_step(self, batch, batch_idx):
	loss, loss_r, loss_ta, loss_t, loss_tn, r_err, ta_err, t_err = self._shared_forward_step(batch, batch_idx)

	self.r_errors['test'].append(r_err)
	self.ta_errors['test'].append(ta_err)
	self.t_errors['test'].append(t_err)

	self._shared_log('test', loss, loss_r, loss_t, loss_ta, loss_tn)

	def _shared_forward_step(self, batch, batch_idx):
	images = batch['images']
	rotation = batch['rotation']
	translation = batch['translation']
	intrinsics = batch['intrinsics']

	image0 = images[:, 0, ...]
	image1 = images[:, 1, ...]

	with torch.no_grad():
	feats0 = self.extractor({'image': image0})
	feats1 = self.extractor({'image': image1})

	if 'scales' in batch:
	scales = batch['scales']
	feats0['keypoints'] *= scales[:, 0].unsqueeze(1)
	feats1['keypoints'] *= scales[:, 1].unsqueeze(1)

	if self.hparams.task == 'scene':
	pred_r, pred_t = self.module({'image0': {feats0, 'intrinsics': intrinsics[:, 0]}, 'image1': {feats1, 'intrinsics': intrinsics[:, 1]}})
	elif self.hparams.task == 'object':
	bboxes = batch['bboxes']
	pred_r, pred_t = self.module({'image0': {feats0, 'intrinsics': intrinsics[:, 0], 'bbox': bboxes[:, 0]}, 'image1': {feats1, 'intrinsics': intrinsics[:, 1]}})

	r_err = rotation_angular_error(pred_r, rotation)
	ta_err = translation_angular_error(pred_t, translation)

	loss_r = self.criterion(r_err, torch.zeros_like(r_err))
	loss_ta = self.criterion(ta_err, torch.zeros_like(ta_err))
	loss_tn = self.criterion(pred_t / pred_t.norm(2, dim=-1, keepdim=True), translation / translation.norm(2, dim=-1, keepdim=True))
	loss_t = self.criterion(pred_t, translation)

	# loss = loss_r * torch.exp(-self.s_r) + loss_t * torch.exp(-self.s_t) + loss_ta * torch.exp(-self.s_ta) + self.s_r + self.s_t + self.s_ta
	loss = loss_r + loss_ta + loss_t + loss_tn

	r_err = r_err.detach()
	ta_err = ta_err.detach()
	t_err = (pred_t.detach() - translation).norm(2, dim=1)

	return loss, loss_r, loss_ta, loss_t, loss_tn, r_err, ta_err, t_err

	def predict_one_data(self, data, device='cuda'):
	st_time = time.time()
	images = data['images'].to(device)
	intrinsics = data['intrinsics'].to(device)

	image0 = images[:, 0, ...]
	image1 = images[:, 1, ...]

	preprocess = time.time()

	with torch.no_grad():
	feats0 = self.extractor({'image': image0})
	feats1 = self.extractor({'image': image1})

	extract_time = time.time()

	if 'scales' in data:
	scales = data['scales'].to(device)
	feats0['keypoints'] *= scales[:, 0].unsqueeze(1)
	feats1['keypoints'] *= scales[:, 1].unsqueeze(1)

	if self.hparams.task == 'scene':
	pred_r, pred_t = self.module({'image0': {feats0, 'intrinsics': intrinsics[:, 0]}, 'image1': {feats1, 'intrinsics': intrinsics[:, 1]}})
	elif self.hparams.task == 'object':
	bboxes = data['bboxes'].to(device)
	pred_r, pred_t = self.module({'image0': {feats0, 'intrinsics': intrinsics[:, 0], 'bbox': bboxes[:, 0]}, 'image1': {feats1, 'intrinsics': intrinsics[:, 1]}})

	regress_time = time.time()

	return pred_r[0], pred_t[0], preprocess-st_time, extract_time-preprocess, regress_time-extract_time


	def _shared_on_epoch_end(self, mode):
	r_errors = torch.hstack(self.r_errors[mode]).rad2deg()
	ta_errors = torch.hstack(self.ta_errors[mode]).rad2deg()
	ta_errors = torch.minimum(ta_errors, 180-ta_errors)

	auc = error_auc(torch.maximum(r_errors, ta_errors).cpu(), [5, 10, 20], mode)
	t_errors = torch.hstack(self.t_errors[mode])

	self.log_dict({
	**auc,
	f'{mode}_Rot./Avg. Error': r_errors.mean(),
	f'{mode}_Rot./Med. Error': r_errors.median(),
	f'{mode}_Rot./@30° ACC': (r_errors < 30).float().mean(),
	f'{mode}_Rot./@15° ACC': (r_errors < 15).float().mean(),
	# f'{mode}_ta/avg': ta_errors.mean(),
	# f'{mode}_ta/med': ta_errors.median(),
	f'{mode}_Trans./Avg. Error': t_errors.mean(),
	f'{mode}_Trans./Med. Error': t_errors.median(),
	f'{mode}_Trans./@10cm ACC': (t_errors < 0.1).float().mean(),
	f'{mode}_Trans./@1m ACC': (t_errors < 1.0).float().mean(),
	}, sync_dist=True)

	self.r_errors[mode].clear()
	self.ta_errors[mode].clear()
	self.t_errors[mode].clear()

	def on_train_epoch_end(self):
	self._shared_on_epoch_end('train')

	def on_validation_epoch_end(self):
	self._shared_on_epoch_end('valid')

	def on_test_epoch_end(self):
	self._shared_on_epoch_end('test')

	def configure_optimizers(self):
	optimizer = torch.optim.AdamW(self.module.parameters(), lr=self.hparams.lr)
	scheduler = torch.optim.lr_scheduler.OneCycleLR(optimizer, max_lr=self.hparams.lr, steps_per_epoch=1, epochs=self.hparams.epochs, pct_start=self.hparams.pct_start)

	return {
	'optimizer': optimizer,
	'lr_scheduler': scheduler
	}