Upload folder using huggingface_hub

e942d15 verified 7 months ago

6.59 kB

	"""
	Main training script for Smoker Detection with LoRA.

	Usage:
	python train.py --data_path /path/to/data --epochs 15 --lr 1e-4 --rank 8
	"""

	import argparse
	from pathlib import Path
	import torch

	from src.model import get_model, apply_lora_to_model, count_parameters
	from src.dataset import create_dataloaders
	from src.train import train_model, get_optimizer_and_criterion
	from src.evaluate import (
	evaluate_model,
	print_classification_report,
	plot_confusion_matrix,
	plot_training_history
	)
	from src.utils import set_seed, get_device, create_directories, print_dataset_info


	def parse_args():
	"""Parse command line arguments."""
	parser = argparse.ArgumentParser(description='Train Smoker Detection Model with LoRA')

	# Data arguments
	parser.add_argument('--data_path', type=str, default='/kaggle/input/smoking',
	help='Path to dataset root directory')

	# Model arguments
	parser.add_argument('--rank', type=int, default=8,
	help='LoRA rank (default: 8)')
	parser.add_argument('--target_layers', nargs='+', default=['layer3', 'layer4'],
	help='Layers to apply LoRA to (default: layer3 layer4)')

	# Training arguments
	parser.add_argument('--epochs', type=int, default=15,
	help='Number of training epochs (default: 15)')
	parser.add_argument('--batch_size', type=int, default=32,
	help='Batch size (default: 32)')
	parser.add_argument('--lr', type=float, default=1e-4,
	help='Learning rate (default: 1e-4)')
	parser.add_argument('--weight_decay', type=float, default=1e-4,
	help='Weight decay (default: 1e-4)')
	parser.add_argument('--img_size', type=int, default=224,
	help='Image size (default: 224)')
	parser.add_argument('--num_workers', type=int, default=2,
	help='Number of data loading workers (default: 2)')

	# Output arguments
	parser.add_argument('--output_dir', type=str, default='results',
	help='Directory to save outputs (default: results)')
	parser.add_argument('--model_save_path', type=str, default='best_model.pth',
	help='Path to save best model (default: best_model.pth)')

	# Other arguments
	parser.add_argument('--seed', type=int, default=42,
	help='Random seed (default: 42)')
	parser.add_argument('--no_cuda', action='store_true',
	help='Disable CUDA even if available')

	return parser.parse_args()


	def main():
	"""Main training function."""
	args = parse_args()

	# Setup
	print("\n" + "="*60)
	print("🚀 Smoker Detection Training with LoRA")
	print("="*60 + "\n")

	# Set seed for reproducibility
	set_seed(args.seed)

	# Create output directory
	create_directories([args.output_dir])

	# Get device
	device = get_device()
	if args.no_cuda:
	device = torch.device('cpu')
	print("CUDA disabled by user, using CPU")

	# Data paths
	data_path = Path(args.data_path)
	train_path = data_path / 'Training' / 'Training'
	val_path = data_path / 'Validation' / 'Validation'
	test_path = data_path / 'Testing' / 'Testing'

	# Create dataloaders
	print("\n📦 Loading data...")
	train_loader, val_loader, test_loader = create_dataloaders(
	train_path=train_path,
	val_path=val_path,
	test_path=test_path,
	batch_size=args.batch_size,
	img_size=args.img_size,
	num_workers=args.num_workers
	)

	# Print dataset info
	print_dataset_info(train_loader, val_loader, test_loader)

	# Create model
	print("\n🏗️ Building model...")
	model = get_model(num_classes=2, pretrained=True)
	model = model.to(device)

	# Apply LoRA
	print(f"\n🔧 Applying LoRA (rank={args.rank})...")
	num_lora_layers = apply_lora_to_model(
	model,
	target_layers=args.target_layers,
	rank=args.rank
	)
	print(f"✅ LoRA applied to {num_lora_layers} convolutional layers")

	# Count parameters
	total_params, trainable_params, trainable_pct = count_parameters(model)
	print(f"\n📊 Parameter Count:")
	print(f" Total: {total_params:,}")
	print(f" Trainable: {trainable_params:,} ({trainable_pct:.2f}%)")
	print(f" Frozen: {total_params - trainable_params:,} ({100 - trainable_pct:.2f}%)")

	# Get optimizer and criterion
	print("\n⚙️ Setting up training...")
	optimizer, criterion = get_optimizer_and_criterion(
	model,
	lr=args.lr,
	weight_decay=args.weight_decay
	)

	# Train model
	print("\n" + "="*60)
	history = train_model(
	model=model,
	train_loader=train_loader,
	val_loader=val_loader,
	criterion=criterion,
	optimizer=optimizer,
	device=device,
	num_epochs=args.epochs,
	save_path=args.model_save_path
	)

	# Plot training curves
	print("\n📊 Plotting training history...")
	fig = plot_training_history(
	history,
	save_path=f'{args.output_dir}/training_curves.png'
	)

	# Evaluate on test set
	print("\n" + "="*60)
	print("🧪 Testing on held-out test set...")
	print("="*60)

	# Load best model
	model.load_state_dict(torch.load(args.model_save_path))

	# Get predictions
	predictions, labels, test_acc = evaluate_model(
	model, test_loader, device
	)

	# Print classification report
	print_classification_report(predictions, labels)

	# Plot confusion matrix
	print("\n📊 Plotting confusion matrix...")
	fig = plot_confusion_matrix(
	predictions,
	labels,
	save_path=f'{args.output_dir}/confusion_matrix.png'
	)

	# Final summary
	print("\n" + "="*60)
	print("✅ Training Complete!")
	print("="*60)
	print(f"\n📁 Outputs saved to: {args.output_dir}/")
	print(f" - Training curves: {args.output_dir}/training_curves.png")
	print(f" - Confusion matrix: {args.output_dir}/confusion_matrix.png")
	print(f" - Best model: {args.model_save_path}")
	print(f"\n🎯 Final Test Accuracy: {test_acc:.2f}%\n")


	if __name__ == '__main__':
	main()