added training script and model parameters

Browse files

Files changed (6) hide show

.gitignore +4 -0
README.md +4 -0
modules/model.py +68 -0
requirements.txt +22 -0
resnetModel_128_epoch_2.pt +3 -0
train.py +146 -0

.gitignore ADDED Viewed

	@@ -0,0 +1,4 @@

+venv
+celeba
+.DS_Store
+**__pycache__

README.md CHANGED Viewed

@@ -1,3 +1,7 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
 ---
+# Gender-CNN
+Model parameters and code used to train my gender classification CNN.

modules/model.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import torch.nn as nn
+import torch.nn.functional as F
+def conv_block(in_channels, out_channels, pool=False):
+    layers = [
+        nn.Conv2d(
+            in_channels,
+            out_channels,
+            kernel_size=3,
+            padding=1
+        ),
+        nn.BatchNorm2d(out_channels),
+        nn.ReLU()
+    ]
+    if pool:
+        layers.append(
+            nn.MaxPool2d(4)
+        )
+    return nn.Sequential(*layers)
+class resnetModel_128(nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.model_name = 'resnetModel_128'
+        self.conv_1 = conv_block(1, 64)
+        self.res_1 = nn.Sequential(
+            conv_block(64, 64),
+            conv_block(64, 64)
+        )
+        self.conv_2 = conv_block(64, 256, pool=True)
+        self.res_2 = nn.Sequential(
+            conv_block(256, 256),
+            conv_block(256, 256)
+        )
+        self.conv_3 = conv_block(256, 512, pool=True)
+        self.res_3 = nn.Sequential(
+            conv_block(512, 512),
+            conv_block(512, 512)
+        )
+        self.conv_4 = conv_block(512, 1024, pool=True)
+        self.res_4 = nn.Sequential(
+            conv_block(1024, 1024),
+            conv_block(1024, 1024)
+        )
+        self.classifier = nn.Sequential(
+            nn.Flatten(),
+            nn.Linear(2*2*1024, 2048),
+            nn.Dropout(0.5),
+            nn.ReLU(),
+            nn.Linear(2048, 1024),
+            nn.Dropout(0.5),
+            nn.ReLU(),
+            nn.Linear(1024, 2)
+        )
+    def forward(self, x):
+        x = self.conv_1(x)
+        x = self.res_1(x) + x
+        x = self.conv_2(x)
+        x = self.res_2(x) + x
+        x = self.conv_3(x)
+        x = self.res_3(x) + x
+        x = self.conv_4(x)
+        x = self.res_4(x) + x
+        x = self.classifier(x)
+        x = F.softmax(x, dim=1)
+        return x

requirements.txt ADDED Viewed

	@@ -0,0 +1,22 @@

+beautifulsoup4==4.12.3
+certifi==2024.2.2
+charset-normalizer==3.3.2
+filelock==3.14.0
+fsspec==2024.5.0
+gdown==5.2.0
+idna==3.7
+Jinja2==3.1.4
+MarkupSafe==2.1.5
+mpmath==1.3.0
+networkx==3.3
+numpy==1.26.4
+pillow==10.3.0
+PySocks==1.7.1
+requests==2.31.0
+soupsieve==2.5
+sympy==1.12
+torch==2.3.0
+torchvision==0.18.0
+tqdm==4.66.4
+typing_extensions==4.11.0
+urllib3==2.2.1

resnetModel_128_epoch_2.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ca00eb610198d7b4c0674a107046cbe07ea538f9e91f9e19ca308fc53de1ca1
+size 165675368

train.py ADDED Viewed

	@@ -0,0 +1,146 @@

+import os
+import gdown
+import zipfile
+import shutil
+import torch
+import torch.nn as nn
+import torchvision.datasets as datasets
+import torchvision.transforms as transforms
+from torch.utils.data import DataLoader
+import time
+import modules.model as model
+# Download model if not available
+if os.path.exists('celeba/') == False:
+    url = 'https://drive.google.com/file/d/13vkq4tFCPE8O78KTj84HHM6kBnYkt8gP/view?usp=sharing'
+    output = 'download.zip'
+    gdown.download(url, output, fuzzy=True)
+    with zipfile.ZipFile(output, 'r') as zip_ref:
+        zip_ref.extractall()
+    os.remove(output)
+    shutil.rmtree('__MACOSX')
+# Set device
+if torch.backends.mps.is_available():
+    device = torch.device('mps')
+    device_name = 'Apple Silicon GPU'
+elif torch.cuda.is_available():
+    device = torch.device('cuda')
+    device_name = 'CUDA'
+else:
+    device = torch.device('cpu')
+    device_name = 'CPU'
+torch.set_default_device(device)
+print(f'\nDevice: {device_name}')
+# Define dataset, dataloader and transform
+imsize = int(128/0.8)
+batch_size = 10
+fivecrop_transform = transforms.Compose([
+    transforms.Resize([imsize, imsize]),
+    transforms.Grayscale(1),
+    transforms.FiveCrop(int(imsize*0.8)),
+    transforms.Lambda(lambda crops: torch.stack([transforms.ToTensor()(crop) for crop in crops])),
+    transforms.Normalize(0, 1)
+])
+train_dataset = datasets.CelebA(
+    root='',
+    split='all',
+    target_type='attr',
+    transform=fivecrop_transform,
+    download=True,
+)
+train_loader = DataLoader(
+    train_dataset,
+    batch_size=batch_size,
+    shuffle=True,
+    generator=torch.Generator(device=device)
+)
+# Male index
+factor = 20
+# Define model, optimiser and scheduler
+torch.manual_seed(2687)
+resnet = model.resnetModel_128()
+criterion = nn.CrossEntropyLoss()
+optimizer = torch.optim.SGD(
+    resnet.parameters(),
+    lr=0.01,
+    momentum=0.9,
+    weight_decay=0.001
+)
+scheduler = torch.optim.lr_scheduler.StepLR(
+    optimizer=optimizer,
+    step_size=1,
+    gamma=0.1
+)
+def mins_to_hours(mins):
+    hours = int(mins/60)
+    rem_mins = mins % 60
+    return hours, rem_mins
+epochs = 2
+train_losses = []
+train_accuracy = []
+for i in range(epochs):
+    epoch_time = 0
+    for j, (X_train, y_train) in enumerate(train_loader):
+        batch_start = time.time()
+        X_train = X_train.to(device)
+        y_train = y_train[:, factor]
+        bs, ncrops, c, h, w = X_train.size()
+        y_pred_crops = resnet.forward(X_train.view(-1, c, h, w))
+        y_pred = y_pred_crops.view(bs, ncrops, -1).mean(1)
+        loss = criterion(y_pred, y_train)
+        predicted = torch.max(y_pred.data, 1)[1]
+        train_batch_accuracy = (predicted == y_train).sum()/len(X_train)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+        train_losses.append(loss.item())
+        train_accuracy.append(train_batch_accuracy.item())
+        batch_end = time.time()
+        batch_time = batch_end - batch_start
+        epoch_time += batch_time
+        avg_batch_time = epoch_time/(j+1)
+        batches_remaining = len(train_loader)-(j+1)
+        epoch_mins_remaining = round(batches_remaining*avg_batch_time/60)
+        epoch_time_remaining = mins_to_hours(epoch_mins_remaining)
+        full_epoch = avg_batch_time*len(train_loader)
+        epochs_remaining = epochs-(i+1)
+        rem_epoch_mins_remaining = epoch_mins_remaining+round(full_epoch*epochs_remaining/60)
+        rem_epoch_time_remaining = mins_to_hours(rem_epoch_mins_remaining)
+        if (j+1) % 10 == 0:
+            print(f'\nEpoch: {i+1}/{epochs} | Train Batch: {j+1}/{len(train_loader)}')
+            print(f'Current epoch: {epoch_time_remaining[0]} hours {epoch_time_remaining[1]} minutes')
+            print(f'Remaining epochs: {rem_epoch_time_remaining[0]} hours {rem_epoch_time_remaining[1]} minutes')
+            print(f'Train Loss: {loss}')
+            print(f'Train Accuracy: {train_batch_accuracy}')
+    scheduler.step()
+    trained_model_name = resnet.model_name + '_epoch_' + str(i+1) + '.pt'
+    torch.save(
+        resnet.state_dict(),
+        trained_model_name
+    )