Spaces:

foreversheikh
/

new_fix

No application file

App Files Files Community

new_fix / utils /callbacks.py

foreversheikh

Upload 60 files

8ad412d verified 3 months ago

raw

history blame contribute delete

6.5 kB

	"""This module contains callbacks to be used along with `TorchModel`."""

	import datetime
	import logging
	import os
	import time
	from abc import ABC, abstractmethod

	import matplotlib.pyplot as plt


	class Callback(ABC):
	@abstractmethod
	def on_training_start(self, epochs) -> None:
	pass

	@abstractmethod
	def on_training_end(self, model) -> None:
	pass

	@abstractmethod
	def on_epoch_start(self, epoch_num, epoch_iterations) -> None:
	pass

	@abstractmethod
	def on_epoch_step(self, global_iteration, epoch_iteration, loss) -> None:
	pass

	@abstractmethod
	def on_epoch_end(self, loss) -> None:
	pass

	@abstractmethod
	def on_evaluation_start(self, val_iterations) -> None:
	pass

	@abstractmethod
	def on_evaluation_step(self, iteration, model_outputs, targets, loss) -> None:
	pass

	@abstractmethod
	def on_evaluation_end(self) -> None:
	pass

	@abstractmethod
	def on_training_iteration_end(self, train_loss, val_loss) -> None:
	pass


	class DefaultModelCallback(Callback):
	"""A callback that simply logs the loss for epochs during training and
	evaluation."""

	def __init__(self, log_every=10, visualization_dir=None) -> None:
	"""
	Args:
	log_every (iterations): logging intervals
	"""
	super().__init__()
	self.visualization_dir = visualization_dir
	self._log_every = log_every
	self._epochs = 0
	self._epoch = 0
	self._epoch_iterations = 0
	self._val_iterations = 0
	self._start_time = 0.0
	self._train_losses = []
	self._val_loss = []

	def on_training_start(self, epochs) -> None:
	logging.info(f"Training for {epochs} epochs")
	self._epochs = epochs
	self._train_losses = []
	self._val_loss = []

	def on_training_end(self, model) -> None:
	if self.visualization_dir is not None:
	plt.figure()
	plt.xlabel("Epoch")
	plt.ylabel("Loss")

	plt.plot(
	range(1, self._epochs + 1), self._train_losses, label="Training loss"
	)
	if self._val_loss:
	plt.plot(
	range(1, self._epochs + 1), self._val_loss, label="Validation loss"
	)

	plt.savefig(os.path.join(self.visualization_dir, "loss.png"))
	plt.close()

	def on_epoch_start(self, epoch_num: int, epoch_iterations: int) -> None:
	self._epoch = epoch_num
	self._epoch_iterations = epoch_iterations
	self._start_time = time.time()

	def on_epoch_step(
	self, global_iteration: int, epoch_iteration: int, loss: float
	) -> None:
	if epoch_iteration % self._log_every == 0:
	average_time = round(
	(time.time() - self._start_time) / (epoch_iteration + 1), 3
	)

	loss_string = f"loss: {loss}"

	# pylint: disable=line-too-long
	logging.info(
	f"Epoch {self._epoch}/{self._epochs} Iteration {epoch_iteration}/{self._epoch_iterations} {loss_string} Time: {average_time} seconds/iteration"
	)

	def on_epoch_end(self, loss) -> None:
	self._train_losses.append(loss)

	def on_evaluation_start(self, val_iterations) -> None:
	self._val_iterations = val_iterations

	def on_evaluation_step(self, iteration, model_outputs, targets, loss) -> None:
	if iteration % self._log_every == 0:
	logging.info(f"Iteration {iteration}/{self._val_iterations}")

	def on_evaluation_end(self) -> None:
	pass

	def on_training_iteration_end(self, train_loss, val_loss) -> None:
	# pylint: disable=line-too-long
	train_loss_string = f"Train loss: {train_loss}"
	if val_loss:
	val_loss_string = f"Validation loss: {val_loss}"
	logging.info(
	f"""
	============================================================================================================================
	Epoch {self._epoch}/{self._epochs} {train_loss_string} {val_loss_string} time: {datetime.timedelta(seconds=time.time() - self._start_time)}
	============================================================================================================================
	"""
	)

	else:
	logging.info(
	f"""
	============================================================================================================================
	Epoch {self._epoch}/{self._epochs} {train_loss_string} time: {datetime.timedelta(seconds=time.time() - self._start_time)}
	============================================================================================================================
	"""
	)


	class TensorBoardCallback(Callback):
	"""A callback that simply logs the loss for epochs during training and
	evaluation."""

	def __init__(self, tb_writer) -> None:
	"""
	Args:
	tb_writer: tensorboard logger instance
	"""
	super().__init__()
	self.tb_writer = tb_writer
	self.epoch = 0

	def on_training_start(self, epochs) -> None:
	pass

	def on_training_end(self, model) -> None:
	pass

	def on_epoch_start(self, epoch_num, epoch_iterations) -> None:
	self.epoch = epoch_num

	def on_epoch_step(self, global_iteration, epoch_iteration, loss) -> None:
	self.tb_writer.add_scalars(
	"Train loss (iterations)", {"Loss": loss}, global_iteration
	)

	def on_epoch_end(self, loss) -> None:
	pass

	def on_evaluation_start(self, val_iterations) -> None:
	pass

	def on_evaluation_step(self, iteration, model_outputs, targets, loss) -> None:
	pass

	def on_evaluation_end(self) -> None:
	pass

	def on_training_iteration_end(self, train_loss, val_loss) -> None:
	if train_loss is not None:
	self.tb_writer.add_scalars(
	"Epoch loss", {"Loss (train)": train_loss}, self.epoch
	)

	if val_loss is not None:
	self.tb_writer.add_scalars(
	"Epoch loss", {"Loss (validation)": val_loss}, self.epoch
	)