ontocord
/

seed2

huu-ontocord commited on Jun 21, 2025

Commit

bf135db

verified ·

1 Parent(s): a7bfe63

Update seed2_tokenizer.py

Files changed (1) hide show

seed2_tokenizer.py CHANGED Viewed

@@ -1654,7 +1654,7 @@ class Blip2Base(PreTrainedModel):
     @classmethod
     def init_Qformer(cls, encoder_config, num_query_token, vision_width, cross_attention_freq=2, cache_dir=""):
-        #print ("loading")
         encoder_config = BertConfig.from_pretrained("bert-base-uncased")
         encoder_config.encoder_width = vision_width
         # insert cross-attention layer every other block
@@ -2091,10 +2091,11 @@ class Seed2Tokenizer(PreTrainedModel):
         ])
         shape_latents = torch.Size([1, 4, 96, 96])
-        self.latents = torch.randn(shape_latents, generator=None, layout=torch.strided)
         shape_noise = torch.Size([1, 1024])
-        self.noise = torch.randn(shape_noise, generator=None, layout=torch.strided)
         self.model = model
         self.processor = processor
@@ -2183,5 +2184,4 @@ class Seed2Tokenizer(PreTrainedModel):
             image_torch = image_torch.to(self.device)
         return self.encode(image_torch, visual_encoder)

     @classmethod
     def init_Qformer(cls, encoder_config, num_query_token, vision_width, cross_attention_freq=2, cache_dir=""):
+        print ("loading")
         encoder_config = BertConfig.from_pretrained("bert-base-uncased")
         encoder_config.encoder_width = vision_width
         # insert cross-attention layer every other block
         ])
         shape_latents = torch.Size([1, 4, 96, 96])
+        self.register_buffer("latents",torch.randn(shape_latents, generator=None, layout=torch.strided))
         shape_noise = torch.Size([1, 1024])
+        self.register_buffer("noise",torch.randn(shape_noise, generator=None, layout=torch.strided))
         self.model = model
         self.processor = processor
             image_torch = image_torch.to(self.device)
         return self.encode(image_torch, visual_encoder)