ZhengPeng7
/

BiRefNet-legacy

@@ -166,8 +166,8 @@ import torch
 import torch.nn as nn
 from functools import partial
-from timm.models.layers import DropPath, to_2tuple, trunc_normal_
-from timm.models.registry import register_model
 import math
@@ -547,7 +547,6 @@ def _conv_filter(state_dict, patch_size=16):
     return out_dict
-## @register_model
 class pvt_v2_b0(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b0, self).__init__(
@@ -557,7 +556,6 @@ class pvt_v2_b0(PyramidVisionTransformerImpr):
-## @register_model
 class pvt_v2_b1(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b1, self).__init__(
@@ -565,7 +563,6 @@ class pvt_v2_b1(PyramidVisionTransformerImpr):
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[2, 2, 2, 2], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1)
-## @register_model
 class pvt_v2_b2(PyramidVisionTransformerImpr):
     def __init__(self, in_channels=3, **kwargs):
         super(pvt_v2_b2, self).__init__(
@@ -573,7 +570,6 @@ class pvt_v2_b2(PyramidVisionTransformerImpr):
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[3, 4, 6, 3], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1, in_channels=in_channels)
-## @register_model
 class pvt_v2_b3(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b3, self).__init__(
@@ -581,7 +577,6 @@ class pvt_v2_b3(PyramidVisionTransformerImpr):
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[3, 4, 18, 3], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1)
-## @register_model
 class pvt_v2_b4(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b4, self).__init__(
@@ -590,7 +585,6 @@ class pvt_v2_b4(PyramidVisionTransformerImpr):
             drop_rate=0.0, drop_path_rate=0.1)
-## @register_model
 class pvt_v2_b5(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b5, self).__init__(
@@ -614,7 +608,7 @@ import torch.nn as nn
 import torch.nn.functional as F
 import torch.utils.checkpoint as checkpoint
 import numpy as np
-from timm.models.layers import DropPath, to_2tuple, trunc_normal_
 # from config import Config
@@ -1195,7 +1189,7 @@ class SwinTransformer(nn.Module):
             # interpolate the position embedding to the corresponding size
             absolute_pos_embed = F.interpolate(self.absolute_pos_embed, size=(Wh, Ww), mode='bicubic')
             x = (x + absolute_pos_embed) # B Wh*Ww C
         outs = []#x.contiguous()]
         x = x.flatten(2).transpose(1, 2)
         x = self.pos_drop(x)
@@ -1252,13 +1246,13 @@ class DeformableConv2d(nn.Module):
                  bias=False):
         super(DeformableConv2d, self).__init__()
         assert type(kernel_size) == tuple or type(kernel_size) == int
         kernel_size = kernel_size if type(kernel_size) == tuple else (kernel_size, kernel_size)
         self.stride = stride if type(stride) == tuple else (stride, stride)
         self.padding = padding
         self.offset_conv = nn.Conv2d(in_channels,
                                      2 * kernel_size[0] * kernel_size[1],
                                      kernel_size=kernel_size,
@@ -1268,7 +1262,7 @@ class DeformableConv2d(nn.Module):
         nn.init.constant_(self.offset_conv.weight, 0.)
         nn.init.constant_(self.offset_conv.bias, 0.)
         self.modulator_conv = nn.Conv2d(in_channels,
                                      1 * kernel_size[0] * kernel_size[1],
                                      kernel_size=kernel_size,
@@ -1292,7 +1286,7 @@ class DeformableConv2d(nn.Module):
         offset = self.offset_conv(x)#.clamp(-max_offset, max_offset)
         modulator = 2. * torch.sigmoid(self.modulator_conv(x))
         x = deform_conv2d(
             input=x,
             offset=offset,
@@ -1490,7 +1484,7 @@ class ResBlk(nn.Module):
         self.conv_out = nn.Conv2d(inter_channels, out_channels, 3, 1, padding=1)
         self.bn_out = nn.BatchNorm2d(out_channels) if config.batch_size > 1 else nn.Identity()
         self.conv_resi = nn.Conv2d(in_channels, out_channels, 1, 1, 0)
     def forward(self, x):
@@ -2141,7 +2135,7 @@ class Decoder(nn.Module):
                 self.gdt_convs_pred_4 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_pred_3 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_pred_2 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_4 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_3 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_2 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))

 import torch.nn as nn
 from functools import partial
+from timm.layers import DropPath, to_2tuple, trunc_normal_
 import math
     return out_dict
 class pvt_v2_b0(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b0, self).__init__(
 class pvt_v2_b1(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b1, self).__init__(
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[2, 2, 2, 2], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1)
 class pvt_v2_b2(PyramidVisionTransformerImpr):
     def __init__(self, in_channels=3, **kwargs):
         super(pvt_v2_b2, self).__init__(
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[3, 4, 6, 3], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1, in_channels=in_channels)
 class pvt_v2_b3(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b3, self).__init__(
             qkv_bias=True, norm_layer=partial(nn.LayerNorm, eps=1e-6), depths=[3, 4, 18, 3], sr_ratios=[8, 4, 2, 1],
             drop_rate=0.0, drop_path_rate=0.1)
 class pvt_v2_b4(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b4, self).__init__(
             drop_rate=0.0, drop_path_rate=0.1)
 class pvt_v2_b5(PyramidVisionTransformerImpr):
     def __init__(self, **kwargs):
         super(pvt_v2_b5, self).__init__(
 import torch.nn.functional as F
 import torch.utils.checkpoint as checkpoint
 import numpy as np
+from timm.layers import DropPath, to_2tuple, trunc_normal_
 # from config import Config
             # interpolate the position embedding to the corresponding size
             absolute_pos_embed = F.interpolate(self.absolute_pos_embed, size=(Wh, Ww), mode='bicubic')
             x = (x + absolute_pos_embed) # B Wh*Ww C
         outs = []#x.contiguous()]
         x = x.flatten(2).transpose(1, 2)
         x = self.pos_drop(x)
                  bias=False):
         super(DeformableConv2d, self).__init__()
         assert type(kernel_size) == tuple or type(kernel_size) == int
         kernel_size = kernel_size if type(kernel_size) == tuple else (kernel_size, kernel_size)
         self.stride = stride if type(stride) == tuple else (stride, stride)
         self.padding = padding
         self.offset_conv = nn.Conv2d(in_channels,
                                      2 * kernel_size[0] * kernel_size[1],
                                      kernel_size=kernel_size,
         nn.init.constant_(self.offset_conv.weight, 0.)
         nn.init.constant_(self.offset_conv.bias, 0.)
         self.modulator_conv = nn.Conv2d(in_channels,
                                      1 * kernel_size[0] * kernel_size[1],
                                      kernel_size=kernel_size,
         offset = self.offset_conv(x)#.clamp(-max_offset, max_offset)
         modulator = 2. * torch.sigmoid(self.modulator_conv(x))
         x = deform_conv2d(
             input=x,
             offset=offset,
         self.conv_out = nn.Conv2d(inter_channels, out_channels, 3, 1, padding=1)
         self.bn_out = nn.BatchNorm2d(out_channels) if config.batch_size > 1 else nn.Identity()
         self.conv_resi = nn.Conv2d(in_channels, out_channels, 1, 1, 0)
     def forward(self, x):
                 self.gdt_convs_pred_4 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_pred_3 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_pred_2 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_4 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_3 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))
                 self.gdt_convs_attn_2 = nn.Sequential(nn.Conv2d(_N, 1, 1, 1, 0))