FoodClassifier / model.py

Initial commit

9a85b37 verified about 1 month ago

8.48 kB

	import argparse
	import torch # type: ignore
	import torch.nn as nn # type: ignore
	from torchinfo import summary # type: ignore
	import torchvision # type: ignore
	import torchvision.transforms as T # type: ignore
	from torchvision.models import efficientnet_v2_s, EfficientNet_V2_S_Weights # type: ignore
	from torch.utils.data import Subset, DataLoader # type: ignore
	import wandb # type: ignore

	device = torch.device("mps" if torch.backends.mps.is_available() else "cpu")

	# Load the pre-trained EfficientNetV2-S model
	model_weights = EfficientNet_V2_S_Weights.IMAGENET1K_V1
	model = efficientnet_v2_s(weights=model_weights).to(device)
	model.classifier[1] = nn.Linear(in_features=model.classifier[1].in_features, out_features=101).to(device)

	# load dataset and create dataloaders here
	dataset = torchvision.datasets.Food101(root='./data', split='train', download=True)

	# Split the dataset into training and testing sets
	train_size = int(0.8 * len(dataset))
	test_size = len(dataset) - train_size
	train_dataset, test_dataset = torch.utils.data.random_split(dataset, [train_size, test_size])

	# transform functions

	train_transforms = T.Compose([
	T.RandomResizedCrop(224),
	T.RandomHorizontalFlip(),
	T.ColorJitter(0.2, 0.2, 0.2, 0.1),
	model_weights.transforms()
	])

	test_transforms = T.Compose([
	model_weights.transforms()
	])

	# Apply transforms to datasets
	train_dataset.dataset.transform = train_transforms
	test_dataset.dataset.transform = test_transforms

	# Create DataLoaders for training and testing sets
	train_loader = DataLoader(
	train_dataset,
	batch_size=16,
	shuffle=True,
	num_workers=2,
	persistent_workers=True
	)
	test_loader = DataLoader(
	test_dataset,
	batch_size=16,
	shuffle=False,
	num_workers=2,
	persistent_workers=True
	)

	# checkpoint callback
	def save_checkpoint(epoch, model, optimizer, val_loss, path="checkpoints/best_model.pth"):

	torch.save({
	'epoch': epoch,
	'model_state_dict': model.state_dict(),
	'optimizer_state_dict': optimizer.state_dict(),
	'val_loss': val_loss
	}, path)

	print(f"Checkpoint saved at epoch {epoch} to {path}")

	class CheckpointCallback:
	def __init__(self, path="checkpoints/best_model.pth"):
	self.best_loss = float('inf')
	self.path = path

	def __call__(self, epoch, model, optimizer, val_loss):
	if val_loss < self.best_loss:
	self.best_loss = val_loss
	save_checkpoint(epoch, model, optimizer, val_loss, self.path)
	return True
	return False

	# early stopping callback
	class EarlyStopping:
	def __init__(self, patience=3, min_delta=0.0):
	self.patience = patience
	self.min_delta = min_delta
	self.counter = 0
	self.best_loss = float('inf')
	self.early_stop = False

	def __call__(self, val_loss):
	if val_loss < self.best_loss - self.min_delta:
	self.best_loss = val_loss
	self.counter = 0
	else:
	self.counter += 1
	if self.counter >= self.patience:
	self.early_stop = True


	# training function
	def train_model(run, model, train_loader, val_loader, loss_fn, optimizer, device, epochs=5, checkpoint=None, early_stopping=None):

	global_step = 0

	model.to(device)

	for epoch in range(epochs):
	train_loss = 0.0
	train_accuracy = 0.0
	model.train()

	for images, labels in train_loader:
	images, labels = images.to(device), labels.to(device)

	optimizer.zero_grad()

	y_preds = model(images)
	loss = loss_fn(y_preds, labels)
	loss.backward()
	optimizer.step()

	if global_step % 1 == 0:
	run.log({
	"train/loss": loss.item()
	}, step=global_step)

	global_step += 1

	train_loss += loss.item() * labels.size(0)
	train_accuracy += (y_preds.argmax(dim=1) == labels).sum().item()

	train_loss /= len(train_loader.dataset)
	train_accuracy /= len(train_loader.dataset)
	print(f"Epoch [{epoch + 1}/{epochs}], Loss: {train_loss:.4f} \| Accuracy: {train_accuracy:.4f}")

	# validation phase
	model.eval()
	val_loss = 0.0
	val_accuracy = 0.0

	with torch.no_grad():
	for images, labels in val_loader:
	images, labels = images.to(device), labels.to(device)
	y_preds = model(images)
	loss = loss_fn(y_preds, labels)
	val_loss += loss.item() * images.size(0)
	val_accuracy += (y_preds.argmax(dim=1) == labels).sum().item()

	val_loss /= len(val_loader.dataset)
	val_accuracy /= len(val_loader.dataset)
	print(f"Validation Loss: {val_loss:.4f} \| Validation Accuracy: {val_accuracy:.4f}")

	run.log({
	"val/loss": val_loss,
	"val/accuracy": val_accuracy,
	"train/accuracy": train_accuracy,
	"epoch": epoch + 1,
	}, step=global_step)

	# callbacks

	if checkpoint:
	checkpoint(epoch, model, optimizer, val_loss)

	if early_stopping:
	early_stopping(val_loss)
	if early_stopping.early_stop:
	print("Early stopping triggered")
	break

	run.finish()

	# evaluation function
	def evaluate_model(model, test_loader, loss_fn, device):
	model.eval()
	test_loss = 0.0
	test_accuracy = 0.0

	with torch.no_grad():
	for images, labels in test_loader:
	images, labels = images.to(device), labels.to(device)
	y_preds = model(images)
	loss = loss_fn(y_preds, labels)
	test_loss += loss.item() * images.size(0)
	test_accuracy += (y_preds.argmax(dim=1) == labels).sum().item()

	test_loss /= len(test_loader.dataset)
	test_accuracy /= len(test_loader.dataset)
	print(f"Test Loss: {test_loss:.4f} \| Test Accuracy: {test_accuracy:.4f}")

	# initalization for wandb
	def initialize_wandb(project_name, run_name, config):

	run = wandb.init(
	entity="i24106-code-i",
	project=project_name,
	name=run_name,
	config=config
	)

	return run

	if __name__ == "__main__":
	parser = argparse.ArgumentParser(description="Train EfficientNetV2-S on Food-101 dataset")
	parser.add_argument("--epochs", type=int, default=5, help="Number of training epochs")
	parser.add_argument("--learning_rate", type=float, default=0.001, help="Learning rate for optimizer")
	parser.add_argument("--model_path", type=str, default="checkpoints/best_model.pth", help="Path to save the best model checkpoint")
	parser.add_argument("--log_run_name", type=str, default="EfficientNetV2S_Run", help="WandB run name")
	args = parser.parse_args()

	saved_model = torch.load(args.model_path, map_location=device)
	model.load_state_dict(saved_model['model_state_dict'])
	model.to(device)

	# freeze all layers
	for p in model.features.parameters():
	p.requires_grad = False

	# unfreeze last 2 blocks (tune N = 1,2,3)
	for p in model.features[-2:].parameters():
	p.requires_grad = True


	# Define loss function and optimizer
	loss_fn = nn.CrossEntropyLoss()
	optimizer = torch.optim.Adam([
	{"params": model.features[-2:].parameters(), "lr": 1e-5},
	{"params": model.classifier.parameters(), "lr": 1e-4},
	], weight_decay=1e-4)

	# Create checkpoint and early stopping callbacks
	checkpoint = CheckpointCallback(path=args.model_path)
	early_stopping = EarlyStopping(patience=3, min_delta=0.01)

	# val_loader
	indices = torch.randperm(len(test_dataset))[:int(0.1 * len(test_dataset))]
	val_set = Subset(test_dataset, indices)
	val_loader = DataLoader(val_set, batch_size=32, shuffle=False)

	# # Initialize wandb
	# config = {
	# "epochs": args.epochs,
	# "learning_rate": args.learning_rate,
	# "model": "EfficientNetV2-S",
	# "dataset": "Food-101"
	# }
	# run = initialize_wandb("Food101_Classification", args.log_run_name, config)

	# # Train the model
	# train_model(run, model, val_loader, val_loader, loss_fn, optimizer, device, epochs=args.epochs, checkpoint=checkpoint, early_stopping=early_stopping)

	# # Evaluate the model
	evaluate_model(model, test_loader, loss_fn, device)