detectivejoewest
/

ViT_Autoencoder

Model card Files Files and versions

ViT_Autoencoder / trainer.py

detectivejoewest's picture

detectivejoewest

Upload 7 files

582b238 verified 7 months ago

history blame contribute delete

4.25 kB

	import torch
	import torch.nn.functional as F
	from IPython.display import clear_output

	# @title Trainer
	class Trainer():
	def __init__(self, encoder, decoder, D, vgg, losses, data_len, ema=3, a_disc=1, a_vae=1, a_KL=0.1, isViT=True):
	self.vgg_schedule = None
	self.ema = 2/(ema+1)
	self.a_disc = a_disc
	self.a_vae = a_vae
	self.a_KL = a_KL

	self.isViT = isViT
	self.encoder = encoder
	self.decoder = decoder
	self.D = D
	self.vgg = vgg
	self.encoder_optimizer = torch.optim.Adam(self.encoder.parameters(), lr=1e-5)
	self.encoder_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(self.encoder_optimizer, T_max=50)
	self.decoder_optimizer = torch.optim.Adam(self.decoder.parameters(), lr=1e-5)
	self.decoder_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(self.decoder_optimizer, T_max=50)
	self.D_optimizer = torch.optim.Adam(self.D.parameters(), lr=4e-5)
	self.D_scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(self.D_optimizer, T_max=50)
	self.losses = losses
	self.loss_vals = {loss:0 for loss in losses}
	self.data_len = data_len
	self.loss_record = []
	self.epoch = 1
	self.index = 1
	self.device = torch.device("cuda")

	self.encoder.to(self.device)
	self.decoder.to(self.device)
	self.D.to(self.device)
	self.vgg.to(self.device)

	def train_step(self, x, with_mse=False, freeze_ae=False, freeze_disc=False):
	self.index += 1
	x = x.to(self.device)
	with torch.no_grad():
	x_hat = self.decoder(self.encoder(x.permute(0,2,3,1))).permute(0,3,1,2) if not self.isViT else self.decoder(self.encoder(x))
	if not freeze_disc:
	disc_loss = F.relu(1. - self.D(x)).mean() + F.relu(1. + self.D(x_hat)).mean() # Hinge
	self.D_optimizer.zero_grad()
	disc_loss.backward()
	self.D_optimizer.step()
	self.D_scheduler.step()

	if not freeze_ae:
	z = self.encoder(x.permute(0,2,3,1)) if not self.isViT else self.encoder(x)
	x_hat = self.decoder(z).permute(0,3,1,2) if not self.isViT else self.decoder(z)
	mse = F.mse_loss(x_hat, x)
	KL = 0.5 * (z.mean() ** 2)
	vgg_real = self.vgg(x)
	vgg_fake = self.vgg(x_hat)
	vgg_loss = 0
	for i in range(len(vgg_real)):
	vgg_loss += F.mse_loss(vgg_real[i], vgg_fake[i])

	adv_loss = 0
	if not freeze_disc:
	adv_loss = -(self.D(self.decoder(self.encoder(x))).mean())

	loss = mse * with_mse + self.a_KL* KL + vgg_loss + self.a_vae * adv_loss
	self.encoder_optimizer.zero_grad()
	self.decoder_optimizer.zero_grad()
	loss.backward()
	self.encoder_optimizer.step()
	self.decoder_optimizer.step()
	self.encoder_scheduler.step()
	self.decoder_scheduler.step()

	self.update_batch({"mse":mse.item() if not freeze_ae else 0,
	"gan":disc_loss.item() if not freeze_disc else 0,
	"vgg":vgg_loss.item() if not freeze_ae else 0,
	"KL":z.mean() if not freeze_ae else 0})

	def update_batch(self, loss_vals):
	clear_output(wait=True)
	for record in self.loss_record:
	print(record)
	self.loss_vals = {loss:(1-self.ema)self.loss_vals[loss] + self.emaloss_vals[loss] for loss in self.losses}
	print(f"epoch:{self.epoch} ", end="")
	for loss in self.losses:
	print(f"{loss}: {self.loss_vals[loss]:.3f} ", end="")
	for _ in range(int(self.index * 20 / self.data_len)):
	print("=", end="")
	for _ in range(int(self.index * 20 / self.data_len),20):
	print("-", end="")

	def update_epoch(self):
	self.index = 0
	record = f"epoch:{self.epoch} "
	for loss in self.losses:
	record += f"{loss}: {self.loss_vals[loss]:.3f} "
	self.loss_record.append(record)
	self.epoch += 1