YashNagraj75
/

Latent-Diffusion-Conditional

Yash Nagraj commited on Jan 7, 2025

Commit

95b2cf2

1 Parent(s): aee1300

Add cross attn if needed for conditional latent diffusion

Files changed (1) hide show

models/blocks.py CHANGED Viewed

@@ -109,10 +109,27 @@ class DownBlock(nn.Module):
             out = out + self.residual_input_conv[i](resnet_input)
             # Self Attention
-            batch_size, channels, h, w = out.shape
-            in_attn = out.reshape(batch_size, channels, h*w)
-            in_attn = self.attention_norms[i](in_attn)
-            in_attn = in_attn.transpose(1, 2)
-            out_attn, _ = self.attention[i](in_attn, in_attn, in_attn)
-            out_attn = out.transpose(1, 2).reshape(batch_size, channels, h, w)
-            out = out + out_attn

             out = out + self.residual_input_conv[i](resnet_input)
             # Self Attention
+            if self.attn:
+                batch_size, channels, h, w = out.shape
+                in_attn = out.reshape(batch_size, channels, h*w)
+                in_attn = self.attention_norms[i](in_attn)
+                in_attn = in_attn.transpose(1, 2)
+                out_attn, _ = self.attention[i](in_attn, in_attn, in_attn)
+                out_attn = out.transpose(1, 2).reshape(
+                    batch_size, channels, h, w)
+                out = out + out_attn
+            # Cross Attention
+            if self.cross_attn:
+                assert context not None, "Context must be given for cross_attn"
+                batch_size, channels, h, w = out.shape
+                in_attn = out.reshape(batch_size, channels, h*w)
+                in_attn = self.attention_norms[i](in_attn)
+                in_attn = in_attn.transpose(1, 2)
+                out_attn, _ = self.attention[i](in_attn, in_attn, in_attn)
+                out_attn = out.transpose(1, 2).reshape(
+                    batch_size, channels, h, w)
+                out = out + out_attn
+        out = self.resnet_down_conv(out)
+        return out