Spaces:

RAILKNUST
/

decgan

Paused

App Files Files Community

RAIL-KNUST commited on Jan 29

Commit

9054e98

verified ·

1 Parent(s): 8f5fcc5

adding files for the application

Browse files

Adding files for the model deployment

Files changed (5) hide show

README.md +8 -5
app.py +135 -0
gitattributes +35 -0
networks.py +601 -0
requirements.txt +7 -0

README.md CHANGED Viewed

@@ -1,10 +1,13 @@
 ---
-title: README
-emoji: 😻
-colorFrom: purple
-colorTo: red
 sdk: gradio
 pinned: false
 ---
-Edit this `README.md` markdown file to author your organization card.

 ---
+title: Decgan Demo
+emoji: 📈
+colorFrom: yellow
+colorTo: pink
 sdk: gradio
+sdk_version: 5.41.1
+app_file: app.py
 pinned: false
+short_description: Diversity enhanced cycle gan
 ---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,135 @@

+import gradio as gr
+import torch
+import torch.nn as nn
+from PIL import Image
+import torchvision.transforms as transforms
+import numpy as np
+from huggingface_hub import hf_hub_download
+import os
+# Import your networks (you'll need to upload networks.py to your Space)
+from networks import ResnetGenerator  # Adjust this import based on your networks.py structure
+class CycleGANInference:
+    def __init__(self, model_repo_id, checkpoint_filename_AtoB, checkpoint_filename_BtoA=None):
+        self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+        # Download model checkpoints from Hugging Face Hub
+        checkpoint_path_AtoB = hf_hub_download(
+            repo_id=model_repo_id,
+            filename=checkpoint_filename_AtoB
+        )
+        # Initialize generators
+        # Adjust these parameters based on your model architecture
+        self.netG_A2B = ResnetGenerator(input_nc=3, output_nc=3, ngf=64, n_blocks=9)  # A to B
+        if checkpoint_filename_BtoA:
+            checkpoint_path_BtoA = hf_hub_download(
+                repo_id=model_repo_id,
+                filename=checkpoint_filename_BtoA
+            )
+            self.netG_B2A = ResnetGenerator(input_nc=3, output_nc=3, ngf=64, n_blocks=9)  # B to A
+        else:
+            self.netG_B2A = None
+        # Load model weights
+        self.netG_A2B.load_state_dict(torch.load(checkpoint_path_AtoB, map_location=self.device))
+        if self.netG_B2A and checkpoint_filename_BtoA:
+            self.netG_B2A.load_state_dict(torch.load(checkpoint_path_BtoA, map_location=self.device))
+        # Set to evaluation mode
+        self.netG_A2B.eval()
+        if self.netG_B2A:
+            self.netG_B2A.eval()
+        # Move to device
+        self.netG_A2B.to(self.device)
+        if self.netG_B2A:
+            self.netG_B2A.to(self.device)
+        # Define transforms
+        self.transform = transforms.Compose([
+            transforms.Resize((256, 256)),  # Adjust size based on your model
+            transforms.ToTensor(),
+            transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
+        ])
+        self.inverse_transform = transforms.Compose([
+            transforms.Normalize((-1, -1, -1), (2, 2, 2)),  # Denormalize
+            transforms.ToPILImage()
+        ])
+    def transform_image(self, image, direction="A_to_B"):
+        # Preprocess
+        input_tensor = self.transform(image).unsqueeze(0).to(self.device)
+        with torch.no_grad():
+            if direction == "A_to_B":
+                output_tensor = self.netG_A2B(input_tensor)
+            elif direction == "B_to_A" and self.netG_B2A:
+                output_tensor = self.netG_B2A(input_tensor)
+            else:
+                raise ValueError("Invalid direction or model not available")
+        # Postprocess
+        output_image = self.inverse_transform(output_tensor.squeeze(0).cpu())
+        return output_image
+# Initialize your model
+# Replace these with your actual Hugging Face repo ID and checkpoint filenames
+MODEL_REPO_ID = "profmatthew/decgan"  # Replace with your repo
+CHECKPOINT_A2B = "200_net_G_A.pth"  # Replace with your checkpoint filename
+CHECKPOINT_B2A = "200_net_G_B.pth"  # Replace with your checkpoint filename (optional)
+cyclegan_model = CycleGANInference(
+    model_repo_id=MODEL_REPO_ID,
+    checkpoint_filename_AtoB=CHECKPOINT_A2B,
+    checkpoint_filename_BtoA=CHECKPOINT_B2A  # Set to None if you only have one direction
+)
+def generate_image(input_image, direction):
+    try:
+        output_image = cyclegan_model.transform_image(input_image, direction)
+        return output_image
+    except Exception as e:
+        return f"Error: {str(e)}"
+# Create Gradio interface
+with gr.Blocks(title="CycleGAN Image Translation") as demo:
+    gr.Markdown("# CycleGAN Image Translation")
+    gr.Markdown("Upload an image and select the transformation direction.")
+    with gr.Row():
+        with gr.Column():
+            input_image = gr.Image(type="pil", label="Input Image")
+            direction = gr.Dropdown(
+                choices=["A_to_B", "B_to_A"],
+                value="A_to_B",
+                label="Translation Direction"
+            )
+            generate_btn = gr.Button("Generate", variant="primary")
+        with gr.Column():
+            output_image = gr.Image(type="pil", label="Generated Image")
+    generate_btn.click(
+        fn=generate_image,
+        inputs=[input_image, direction],
+        outputs=output_image
+    )
+    # Add some examples if you have them
+    # gr.Examples(
+    #     examples=[
+    #         # Add paths to example images here
+    #         # ["example1.jpg", "A_to_B"],
+    #         # ["example2.jpg", "B_to_A"],
+    #     ],
+    #     inputs=[input_image, direction],
+    #     outputs=output_image,
+    #     fn=generate_image,
+    # )
+if __name__ == "__main__":
+    demo.launch()

gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

networks.py ADDED Viewed

	@@ -0,0 +1,601 @@

+import torch
+import torch.nn as nn
+from torch.nn import init
+import functools
+from torch.optim import lr_scheduler
+import torch.nn.functional as F
+from torch import nn, einsum
+from einops import rearrange, reduce, repeat
+###############################################################################
+# Helper Functions
+###############################################################################
+class SelfAttention(nn.Module):
+    """ Self attention Layer"""
+    def __init__(self, input_channel, activation="relu"):
+        super(SelfAttention, self).__init__()
+        self.chanel_in = input_channel
+        self.activation = activation
+        self.query_conv = nn.Conv2d(input_channel, input_channel // 8, 1)
+        self.key_conv = nn.Conv2d(input_channel, input_channel // 8, 1)
+        self.value_conv = nn.Conv2d(input_channel, input_channel, 1)
+        self.gamma = nn.Parameter(torch.zeros(1))
+        self.softmax = nn.Softmax(dim=-1)
+    def forward(self, x):
+        print("Attention Mechanism!")
+        m_batchsize, C, width, height = x.size()
+        attention_query = self.query_conv(x).view(m_batchsize, -1, width * height).permute(0, 2, 1)  # B X CX(N) # Q
+        attention_key = self.key_conv(x).view(m_batchsize, -1, width * height)  # B X C x (*W*H)  # K
+        energy = torch.bmm(attention_query, attention_key)  # transpose check
+        attention = self.softmax(energy)  # BX (N) X (N)
+        attention_value = self.value_conv(x).view(m_batchsize, -1, width * height)  # B X C X N
+        out = torch.bmm(attention_value, attention.permute(0, 2, 1))
+        out = out.view(m_batchsize, C, width, height)
+        out = self.gamma * out + x
+        return out
+def get_norm_layer(norm_type='instance'):
+    if norm_type == 'batch':
+        norm_layer = functools.partial(nn.BatchNorm2d, affine=True)
+    elif norm_type == 'instance':
+        norm_layer = functools.partial(nn.InstanceNorm2d, affine=False, track_running_stats=False)
+    elif norm_type == 'none':
+        norm_layer = None
+    else:
+        raise NotImplementedError('normalization layer [%s] is not found' % norm_type)
+    return norm_layer
+def get_scheduler(optimizer, opt):
+    if opt.lr_policy == 'lambda':
+        def lambda_rule(epoch):
+            lr_l = 1.0 - max(0, epoch + opt.epoch_count - opt.niter) / float(opt.niter_decay + 1)
+            return lr_l
+        scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda_rule)
+    elif opt.lr_policy == 'step':
+        scheduler = lr_scheduler.StepLR(optimizer, step_size=opt.lr_decay_iters, gamma=0.1)
+    elif opt.lr_policy == 'plateau':
+        scheduler = lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.2, threshold=0.01, patience=5)
+    elif opt.lr_policy == 'cosine':
+        scheduler = lr_scheduler.CosineAnnealingLR(optimizer, T_max=opt.niter, eta_min=0)
+    else:
+        return NotImplementedError('learning rate policy [%s] is not implemented', opt.lr_policy)
+    return scheduler
+def init_weights(net, init_type='normal', gain=0.02):
+    def init_func(m):
+        classname = m.__class__.__name__
+        if hasattr(m, 'weight') and (classname.find('Conv') != -1 or classname.find('Linear') != -1):
+            if init_type == 'normal':
+                init.normal_(m.weight.data, 0.0, gain)
+            elif init_type == 'xavier':
+                init.xavier_normal_(m.weight.data, gain=gain)
+            elif init_type == 'kaiming':
+                init.kaiming_normal_(m.weight.data, a=0, mode='fan_in')
+            elif init_type == 'orthogonal':
+                init.orthogonal_(m.weight.data, gain=gain)
+            else:
+                raise NotImplementedError('initialization method [%s] is not implemented' % init_type)
+            if hasattr(m, 'bias') and m.bias is not None:
+                init.constant_(m.bias.data, 0.0)
+        elif classname.find('BatchNorm2d') != -1:
+            init.normal_(m.weight.data, 1.0, gain)
+            init.constant_(m.bias.data, 0.0)
+    print('initialize network with %s' % init_type)
+    net.apply(init_func)
+def init_net(net, init_type='normal', init_gain=0.02, gpu_ids=[]):
+    if len(gpu_ids) > 0:
+        assert(torch.cuda.is_available())
+        net.to(gpu_ids[0])
+        net = torch.nn.DataParallel(net, gpu_ids)
+    init_weights(net, init_type, gain=init_gain)
+    return net
+##############################################################################
+# Classes
+##############################################################################
+# Defines the GAN loss which uses either LSGAN or the regular GAN.
+# When LSGAN is used, it is basically same as MSELoss,
+# but it abstracts away the need to create the target label tensor
+# that has the same size as the input
+class GANLoss(nn.Module):
+    def __init__(self, use_lsgan=True, target_real_label=1.0, target_fake_label=0.0):
+        super(GANLoss, self).__init__()
+        self.register_buffer('real_label', torch.tensor(target_real_label))
+        self.register_buffer('fake_label', torch.tensor(target_fake_label))
+        if use_lsgan:
+            self.loss = nn.MSELoss()
+        else:
+            self.loss = nn.BCELoss()
+    def get_target_tensor(self, input, target_is_real):
+        if target_is_real:
+            target_tensor = self.real_label
+        else:
+            target_tensor = self.fake_label
+        return target_tensor.expand_as(input)
+    def __call__(self, input, target_is_real):
+        target_tensor = self.get_target_tensor(input, target_is_real)
+        return self.loss(input, target_tensor)
+#################################################################################
+#                    Critic Loss for Wassertein Gan GP                          #
+#################################################################################
+class GradPenalty(nn.Module):
+    def __init__(self, use_cuda):
+        super(GradPenalty, self).__init__()
+        self.use_cuda = use_cuda
+    def forward(self, critic, real_data, fake_data):
+        alpha = torch.rand_like(real_data)
+        assignGPU = lambda x: x.cuda() if self.use_cuda else x
+        alpha = assignGPU(alpha)
+        interpolates = alpha*real_data + (1-alpha)*fake_data.detach()
+        interpolates = assignGPU(interpolates)
+        interpolates = torch.autograd.Variable(interpolates, requires_grad = True)
+        critic_interpolates = critic(interpolates)
+        gradients = torch.autograd.grad(
+            outputs=critic_interpolates,
+            inputs=interpolates,
+            grad_outputs=assignGPU(torch.ones(critic_interpolates.size())),
+            create_graph=True, retain_graph=True, only_inputs=True
+        )[0]
+        gradients = gradients.view(gradients.size(0), -1)
+        gradient_penalty = ((gradients.norm(2, dim=1)-1)**2).mean()
+        return gradient_penalty
+#####
+#####
+#################################################################################
+#                   Hybrid Perception Block and DPSA LAyer                      #
+#################################################################################
+# helper functions
+def exists(val):
+    return val is not None
+def default(val, d):
+    return val if exists(val) else d
+def l2norm(t):
+    return F.normalize(t, dim = -1)
+# helper classes
+class Residual(nn.Module):
+    def __init__(self, fn):
+        super().__init__()
+        self.fn = fn
+    def forward(self, x, **kwargs):
+        return self.fn(x, **kwargs) + x
+class ChanLayerNorm(nn.Module):
+    def __init__(self, dim, eps = 1e-5):
+        super().__init__()
+        self.eps = eps
+        self.g = nn.Parameter(torch.ones(1, dim, 1, 1))
+        self.b = nn.Parameter(torch.zeros(1, dim, 1, 1))
+    def forward(self, x):
+        var = torch.var(x, dim = 1, unbiased = False, keepdim = True)
+        mean = torch.mean(x, dim = 1, keepdim = True)
+        return (x - mean) / (var + self.eps).sqrt() * self.g + self.b
+# classes
+# Defines the generator that consists of Resnet blocks between a few
+# downsampling/upsampling operations.
+# Code and idea from Justin Johnson's architecture.
+# https://github.com/jcjohnson/fast-neural-style/
+class ResnetGenerator(nn.Module):
+    def __init__(self, input_nc, output_nc, ngf=64, norm_layer=nn.InstanceNorm2d, use_dropout=False, n_blocks=6, padding_type='reflect', use_attention=False):
+        assert(n_blocks >= 0)
+        super(ResnetGenerator, self).__init__()
+        self.input_nc = input_nc
+        self.output_nc = output_nc
+        self.ngf = ngf
+        if type(norm_layer) == functools.partial:
+            use_bias = norm_layer.func == nn.InstanceNorm2d
+        else:
+            use_bias = norm_layer == nn.InstanceNorm2d
+        model = [
+            nn.ReflectionPad2d(3),
+                nn.Conv2d(
+                input_nc, ngf,
+                kernel_size=7,
+                padding=0,
+                bias=use_bias
+            ),
+            norm_layer(ngf),
+            nn.ReLU(True)
+        ]
+        n_downsampling = 2
+        for i in range(n_downsampling):
+            mult = 2**i
+            model += [
+                nn.Conv2d(
+                    ngf * mult, ngf * mult * 2, kernel_size=3,
+                    stride=2, padding=1, bias=use_bias
+                ),
+                norm_layer(ngf * mult * 2),
+                nn.ReLU(True)
+            ]
+        mult = 2**n_downsampling
+        for i in range(n_blocks):
+            model += [
+                ResnetBlock(
+                    ngf * mult,
+                    padding_type=padding_type,
+                    norm_layer=norm_layer,
+                    use_dropout=use_dropout,
+                    use_bias=use_bias
+                )
+            ]
+        for i in range(n_downsampling):
+            mult = 2**(n_downsampling - i)
+            model += [
+                nn.ConvTranspose2d(
+                    ngf * mult, int(ngf * mult / 2),
+                    kernel_size=3, stride=2,
+                    padding=1, output_padding=1,
+                    bias=use_bias
+                ),
+                norm_layer(int(ngf * mult / 2)),
+                nn.ReLU(True)
+            ]
+            if use_attention and i==0:
+                model += [SelfAttention(128, 'relu')]
+        model += [nn.ReflectionPad2d(3)]
+        model += [nn.Conv2d(ngf, output_nc, kernel_size=7, padding=0)]
+        model += [nn.Tanh()]
+        self.model = nn.Sequential(*model)
+    def forward(self, input):
+        return self.model(input)
+# Define a resnet block
+class ResnetBlock(nn.Module):
+    def __init__(self, dim, padding_type, norm_layer, use_dropout, use_bias):
+        super(ResnetBlock, self).__init__()
+        self.conv_block = self.build_conv_block(dim, padding_type, norm_layer, use_dropout, use_bias)
+    def build_conv_block(self, dim, padding_type, norm_layer, use_dropout, use_bias):
+        conv_block = []
+        p = 0
+        if padding_type == 'reflect':
+            conv_block += [nn.ReflectionPad2d(1)]
+        elif padding_type == 'replicate':
+            conv_block += [nn.ReplicationPad2d(1)]
+        elif padding_type == 'zero':
+            p = 1
+        else:
+            raise NotImplementedError('padding [%s] is not implemented' % padding_type)
+        conv_block += [
+            nn.Conv2d(dim, dim, kernel_size=3, padding=p, bias=use_bias),
+            norm_layer(dim),
+            nn.ReLU(True)
+        ]
+        if use_dropout:
+            conv_block += [nn.Dropout(0.5)]
+        p = 0
+        if padding_type == 'reflect':
+            conv_block += [nn.ReflectionPad2d(1)]
+        elif padding_type == 'replicate':
+            conv_block += [nn.ReplicationPad2d(1)]
+        elif padding_type == 'zero':
+            p = 1
+        else:
+            raise NotImplementedError('padding [%s] is not implemented' % padding_type)
+        conv_block += [
+            nn.Conv2d(dim, dim, kernel_size=3, padding=p, bias=use_bias),
+            norm_layer(dim)
+        ]
+        return nn.Sequential(*conv_block)
+    def forward(self, x):
+        out = x + self.conv_block(x)
+        return out
+# Defines the Unet generator.
+# |num_downs|: number of downsamplings in UNet. For example,
+# if |num_downs| == 7, image of size 128x128 will become of size 1x1
+# at the bottleneck
+class UnetGenerator(nn.Module):
+    def __init__(
+        self,
+        input_nc,
+        output_nc,
+        num_downs, ngf=64,
+        norm_layer=nn.BatchNorm2d,
+        use_dropout=False
+    ):
+        super(UnetGenerator, self).__init__()
+        # construct unet structure
+        unet_block = UnetSkipConnectionBlock(
+            ngf * 8,
+            ngf * 8,
+            input_nc=None,
+            submodule=None,
+            norm_layer=norm_layer,
+            innermost=True
+        )
+        for i in range(num_downs - 5):
+            unet_block = UnetSkipConnectionBlock(
+                ngf * 8, ngf * 8,
+                input_nc=None,
+                submodule=unet_block,
+                norm_layer=norm_layer,
+                use_dropout=use_dropout
+            )
+        unet_block = UnetSkipConnectionBlock(
+            ngf * 4, ngf * 8,
+            input_nc=None,
+            submodule=unet_block,
+            norm_layer=norm_layer
+        )
+        unet_block = UnetSkipConnectionBlock(
+            ngf * 2, ngf * 4,
+            input_nc=None,
+            submodule=unet_block,
+            norm_layer=norm_layer
+        )
+        unet_block = UnetSkipConnectionBlock(
+            ngf, ngf * 2,
+            input_nc=None,
+            submodule=unet_block,
+            norm_layer=norm_layer
+        )
+        unet_block = UnetSkipConnectionBlock(
+            output_nc, ngf,
+            input_nc=input_nc,
+            submodule=unet_block,
+            outermost=True,
+            norm_layer=norm_layer
+        )
+        self.model = unet_block
+    def forward(self, input):
+        return self.model(input)
+# Defines the submodule with skip connection.
+# X -------------------identity---------------------- X
+#   |-- downsampling -- |submodule| -- upsampling --|
+class UnetSkipConnectionBlock(nn.Module):
+    def __init__(
+        self,
+        outer_nc,
+        inner_nc,
+        input_nc=None,
+        submodule=None,
+        outermost=False,
+        innermost=False,
+        norm_layer=nn.BatchNorm2d,
+        use_dropout=False
+    ):
+        super(UnetSkipConnectionBlock, self).__init__()
+        self.outermost = outermost
+        if type(norm_layer) == functools.partial:
+            use_bias = norm_layer.func == nn.InstanceNorm2d
+        else:
+            use_bias = norm_layer == nn.InstanceNorm2d
+        if input_nc is None:
+            input_nc = outer_nc
+        downconv = nn.Conv2d(
+            input_nc, inner_nc, kernel_size=4,
+            stride=2, padding=1, bias=use_bias
+        )
+        downrelu = nn.LeakyReLU(0.2, True)
+        downnorm = norm_layer(inner_nc)
+        uprelu = nn.ReLU(True)
+        upnorm = norm_layer(outer_nc)
+        if outermost:
+            upconv = nn.ConvTranspose2d(
+                inner_nc * 2, outer_nc,
+                kernel_size=4, stride=2,
+                padding=1
+            )
+            down = [downconv]
+            up = [uprelu, upconv, nn.Tanh()]
+            model = down + [submodule] + up
+        elif innermost:
+            upconv = nn.ConvTranspose2d(
+                inner_nc, outer_nc,
+                kernel_size=4, stride=2,
+                padding=1, bias=use_bias
+            )
+            down = [downrelu, downconv]
+            up = [uprelu, upconv, upnorm]
+            model = down + up
+        else:
+            upconv = nn.ConvTranspose2d(
+                inner_nc * 2, outer_nc,
+                kernel_size=4, stride=2,
+                padding=1, bias=use_bias
+            )
+            down = [downrelu, downconv, downnorm]
+            up = [uprelu, upconv, upnorm]
+            if use_dropout:
+                model = down + [submodule] + up + [nn.Dropout(0.5)]
+            else:
+                model = down + [submodule] + up
+        self.model = nn.Sequential(*model)
+    def forward(self, x):
+        if self.outermost:
+            return self.model(x)
+        else:
+            return torch.cat([x, self.model(x)], 1)
+# Defines the PatchGAN discriminator with the specified arguments.
+class NLayerDiscriminator(nn.Module):
+    def __init__(self, input_nc, ndf=64, n_layers=3, norm_layer=nn.BatchNorm2d, use_sigmoid=False, use_attention=False):
+        super(NLayerDiscriminator, self).__init__()
+        if type(norm_layer) == functools.partial:
+            use_bias = norm_layer.func == nn.InstanceNorm2d
+        else:
+            use_bias = norm_layer == nn.InstanceNorm2d
+        kw = 4
+        padw = 1
+        sequence = [
+            nn.Conv2d(input_nc, ndf, kernel_size=kw, stride=2, padding=padw),
+            nn.LeakyReLU(0.2, True)
+        ]
+        nf_mult = 1
+        nf_mult_prev = 1
+        for n in range(1, n_layers):
+            nf_mult_prev = nf_mult
+            nf_mult = min(2**n, 8)
+            sequence += [
+                nn.Conv2d(
+                    ndf * nf_mult_prev, ndf * nf_mult,
+                    kernel_size=kw, stride=2, padding=padw, bias=use_bias
+                ),
+                norm_layer(ndf * nf_mult),
+                nn.LeakyReLU(0.2, True)
+            ]
+        nf_mult_prev = nf_mult
+        nf_mult = min(2**n_layers, 8)
+        sequence += [
+            nn.Conv2d(
+                ndf * nf_mult_prev, ndf * nf_mult,
+                kernel_size=kw, stride=1,
+                padding=padw, bias=use_bias
+            ),
+            norm_layer(ndf * nf_mult),
+            nn.LeakyReLU(0.2, True)
+        ]
+        if use_attention:
+            sequence += [SelfAttention(512, 'relu')]
+        sequence += [
+            nn.Conv2d(ndf * nf_mult, 1, kernel_size=kw, stride=1, padding=padw)
+        ]
+        if use_sigmoid:
+            sequence += [nn.Sigmoid()]
+        self.model = nn.Sequential(*sequence)
+    def forward(self, input):
+        return self.model(input)
+class NLayerDiscriminatorSN(nn.Module):
+    def __init__(self, input_nc, ndf=64, n_layers=3, use_sigmoid=False, use_attention=False):
+        super(NLayerDiscriminatorSN, self).__init__()
+        use_bias = False
+        kw = 4
+        padw = 1
+        sequence = [
+            SpectralNorm(nn.Conv2d(input_nc, ndf, kernel_size=kw, stride=2, padding=padw)),
+            nn.LeakyReLU(0.2, True)
+        ]
+        nf_mult = 1
+        nf_mult_prev = 1
+        for n in range(1, n_layers):
+            nf_mult_prev = nf_mult
+            nf_mult = min(2**n, 8)
+            sequence += [
+                SpectralNorm(
+                    nn.Conv2d(
+                        ndf * nf_mult_prev,
+                        ndf * nf_mult,
+                        kernel_size=kw, stride=2,
+                        padding=padw, bias=use_bias
+                    )
+                ),
+                nn.LeakyReLU(0.2, True)
+            ]
+        nf_mult_prev = nf_mult
+        nf_mult = min(2**n_layers, 8)
+        sequence += [
+            SpectralNorm(
+                nn.Conv2d(
+                    ndf * nf_mult_prev, ndf * nf_mult,
+                    kernel_size=kw, stride=1, padding=padw, bias=use_bias
+                )
+            ),
+            nn.LeakyReLU(0.2, True)
+        ]
+        if use_attention:
+            sequence += [SelfAttention(512, 'relu')]
+        sequence += [SpectralNorm(nn.Conv2d(ndf * nf_mult, 1, kernel_size=kw, stride=1, padding=padw))]
+        if use_sigmoid:
+            sequence += [nn.Sigmoid()]
+        self.model = nn.Sequential(*sequence)
+    def forward(self, input):
+        return self.model(input)
+class PixelDiscriminator(nn.Module):
+    def __init__(self, input_nc, ndf=64, norm_layer=nn.BatchNorm2d, use_sigmoid=False):
+        super(PixelDiscriminator, self).__init__()
+        if type(norm_layer) == functools.partial:
+            use_bias = norm_layer.func == nn.InstanceNorm2d
+        else:
+            use_bias = norm_layer == nn.InstanceNorm2d
+        self.net = [
+            nn.Conv2d(input_nc, ndf, kernel_size=1, stride=1, padding=0),
+            nn.LeakyReLU(0.2, True),
+            nn.Conv2d(ndf, ndf * 2, kernel_size=1, stride=1, padding=0, bias=use_bias),
+            norm_layer(ndf * 2),
+            nn.LeakyReLU(0.2, True),
+            nn.Conv2d(ndf * 2, 1, kernel_size=1, stride=1, padding=0, bias=use_bias)]
+        if use_sigmoid:
+            self.net.append(nn.Sigmoid())
+        self.net = nn.Sequential(*self.net)
+    def forward(self, input):
+        return self.net(input)

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+gradio
+torch
+torchvision
+Pillow
+numpy
+huggingface_hub
+einops