Spaces:

lolzysiu
/

hellooooo

Sleeping

App Files Files Community

hellooooo / train_wgan.py

lolzysiu

Create train_wgan.py

c971098 verified 9 months ago

raw

history blame contribute delete

3.79 kB

	import torch
	import torch.nn as nn
	import torch.optim as optim
	from torchvision import datasets, transforms
	from torch.utils.data import DataLoader
	from models_conv import ConvGenerator, ConvDiscriminator
	import os
	from torch.utils.tensorboard import SummaryWriter

	# Hyperparameters
	latent_dim = 100
	batch_size = 64
	n_epochs = 200
	lr = 0.00005
	n_critic = 5
	clip_value = 0.01

	# Create directories
	os.makedirs('images', exist_ok=True)
	os.makedirs('checkpoints', exist_ok=True)

	# Initialize tensorboard
	writer = SummaryWriter('runs/wgan_training')

	# Configure data loader
	transform = transforms.Compose([
	transforms.ToTensor(),
	transforms.Normalize([0.5], [0.5])
	])

	dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
	dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

	# Initialize generator and discriminator
	generator = ConvGenerator(latent_dim=latent_dim)
	discriminator = ConvDiscriminator()

	# Optimizers
	g_optimizer = optim.RMSprop(generator.parameters(), lr=lr)
	d_optimizer = optim.RMSprop(discriminator.parameters(), lr=lr)

	# Check if CUDA is available
	device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
	generator.to(device)
	discriminator.to(device)

	print(f'Starting training on {device}...')

	# Training loop
	for epoch in range(n_epochs):
	for i, (real_imgs, _) in enumerate(dataloader):
	real_imgs = real_imgs.to(device)

	# ---------------------
	# Train Discriminator
	# ---------------------
	d_optimizer.zero_grad()

	# Sample noise as generator input
	z = torch.randn(real_imgs.size(0), latent_dim).to(device)

	# Generate a batch of images
	fake_imgs = generator(z).detach()

	# Compute discriminator loss
	d_loss = -torch.mean(discriminator(real_imgs)) + torch.mean(discriminator(fake_imgs))

	d_loss.backward()
	d_optimizer.step()

	# Clip weights of discriminator
	for p in discriminator.parameters():
	p.data.clamp_(-clip_value, clip_value)

	# Train the generator every n_critic iterations
	if i % n_critic == 0:
	# -----------------
	# Train Generator
	# -----------------
	g_optimizer.zero_grad()

	# Generate a batch of images
	gen_imgs = generator(z)

	# Adversarial loss
	g_loss = -torch.mean(discriminator(gen_imgs))

	g_loss.backward()
	g_optimizer.step()

	if i % 100 == 0:
	print(f'[Epoch {epoch}/{n_epochs}] [Batch {i}/{len(dataloader)}] '
	f'[D loss: {d_loss.item():.4f}] [G loss: {g_loss.item():.4f}]')

	# Log losses to tensorboard
	writer.add_scalar('D_loss', d_loss.item(), epoch * len(dataloader) + i)
	writer.add_scalar('G_loss', g_loss.item(), epoch * len(dataloader) + i)

	# Save checkpoints
	if epoch % 10 == 0:
	torch.save({
	'epoch': epoch,
	'generator_state_dict': generator.state_dict(),
	'discriminator_state_dict': discriminator.state_dict(),
	'g_optimizer_state_dict': g_optimizer.state_dict(),
	'd_optimizer_state_dict': d_optimizer.state_dict(),
	}, f'checkpoints/wgan_checkpoint_epoch_{epoch}.pt')

	# Save sample images
	with torch.no_grad():
	z = torch.randn(16, latent_dim).to(device)
	gen_imgs = generator(z)
	for j, img in enumerate(gen_imgs):
	writer.add_image(f'generated_image_{j}', img, epoch)

	print('Training finished!')
	writer.close()