KETI-AIR
/

veld-base

@@ -15,6 +15,7 @@
       "T5DualDecoderDoubleHeadsModel"
     ],
     "bad_words_ids": null,
     "bos_token_id": null,
     "chunk_size_feed_forward": 0,
     "cross_attention_hidden_size": null,
@@ -73,6 +74,7 @@
     "return_dict": true,
     "return_dict_in_generate": false,
     "sep_token_id": null,
     "task_specific_params": null,
     "temperature": 1.0,
     "tf_legacy_loss": false,
@@ -83,7 +85,7 @@
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
-    "transformers_version": "4.22.1",
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
@@ -97,6 +99,7 @@
     ],
     "attention_probs_dropout_prob": 0.0,
     "bad_words_ids": null,
     "bos_token_id": null,
     "chunk_size_feed_forward": 0,
     "cross_attention_hidden_size": null,
@@ -153,6 +156,7 @@
     "return_dict": true,
     "return_dict_in_generate": false,
     "sep_token_id": null,
     "task_specific_params": null,
     "temperature": 1.0,
     "tf_legacy_loss": false,
@@ -163,7 +167,7 @@
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
-    "transformers_version": "4.22.1",
     "typical_p": 1.0,
     "use_bfloat16": false
   },

       "T5DualDecoderDoubleHeadsModel"
     ],
     "bad_words_ids": null,
+    "begin_suppress_tokens": null,
     "bos_token_id": null,
     "chunk_size_feed_forward": 0,
     "cross_attention_hidden_size": null,
     "return_dict": true,
     "return_dict_in_generate": false,
     "sep_token_id": null,
+    "suppress_tokens": null,
     "task_specific_params": null,
     "temperature": 1.0,
     "tf_legacy_loss": false,
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
+    "transformers_version": "4.24.0",
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
     ],
     "attention_probs_dropout_prob": 0.0,
     "bad_words_ids": null,
+    "begin_suppress_tokens": null,
     "bos_token_id": null,
     "chunk_size_feed_forward": 0,
     "cross_attention_hidden_size": null,
     "return_dict": true,
     "return_dict_in_generate": false,
     "sep_token_id": null,
+    "suppress_tokens": null,
     "task_specific_params": null,
     "temperature": 1.0,
     "tf_legacy_loss": false,
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
+    "transformers_version": "4.24.0",
     "typical_p": 1.0,
     "use_bfloat16": false
   },

modeling_veld.py CHANGED Viewed

@@ -1886,7 +1886,7 @@ class VELDModel(PreTrainedModel):
         encoder_hidden_states = None if encoder_outputs is None else encoder_outputs[0]
         pooler_output_local = None if encoder_outputs is None else self.local_pooling(encoder_hidden_states)
-        pooler_output_global = None if encoder_outputs is None else self.global_pooling(pooler_output_local).squeeze(1)
         # optionally project encoder_hidden_states
         if (
@@ -2083,6 +2083,13 @@ if __name__ == "__main__":
     print(outputs.loss)
     print(outputs.c_loss)
     # print(outputs)
     # outputs = model.generate(

         encoder_hidden_states = None if encoder_outputs is None else encoder_outputs[0]
         pooler_output_local = None if encoder_outputs is None else self.local_pooling(encoder_hidden_states)
+        pooler_output_global = None if encoder_outputs is None or return_contrastive_loss is None else self.global_pooling(pooler_output_local).squeeze(1)
         # optionally project encoder_hidden_states
         if (
     print(outputs.loss)
     print(outputs.c_loss)
+    outputs = model(
+        pixel_values=pixel_values,
+        labels=inps.input_ids,
+        decoder_attention_mask=inps.attention_mask)
+    print(outputs.loss)
+    print(outputs.c_loss)
     # print(outputs)
     # outputs = model.generate(