Upload model

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_commit_hash": null,
   "architectures": [
     "SingleCXREncoderDecoderModel"
   ],
@@ -78,7 +77,6 @@
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
-    "transformers_version": "4.31.0",
     "type_vocab_size": 2,
     "typical_p": 1.0,
     "use_bfloat16": false,
@@ -2243,7 +2241,6 @@
     "top_p": 1.0,
     "torch_dtype": "float32",
     "torchscript": false,
-    "transformers_version": "4.31.0",
     "typical_p": 1.0,
     "use_bfloat16": false
   },
@@ -2251,5 +2248,5 @@
   "model_type": "vision-encoder-decoder",
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": null
 }

 {
   "architectures": [
     "SingleCXREncoderDecoderModel"
   ],
     "top_p": 1.0,
     "torch_dtype": null,
     "torchscript": false,
     "type_vocab_size": 2,
     "typical_p": 1.0,
     "use_bfloat16": false,
     "top_p": 1.0,
     "torch_dtype": "float32",
     "torchscript": false,
     "typical_p": 1.0,
     "use_bfloat16": false
   },
   "model_type": "vision-encoder-decoder",
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.36.2"
 }

generation_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
   "_from_model_config": true,
   "pad_token_id": 0,
-  "transformers_version": "4.31.0"
 }

 {
   "_from_model_config": true,
   "pad_token_id": 0,
+  "transformers_version": "4.36.2"
 }

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:403d5035a0416014f4eb226ee57b5ec3ed79911e144b22ac7ceba34c64059370
+size 449521072

modelling_single.py CHANGED Viewed

@@ -6,7 +6,7 @@ import transformers
 from torch.nn import CrossEntropyLoss
 from transformers import PreTrainedTokenizerFast, VisionEncoderDecoderModel
 from transformers.configuration_utils import PretrainedConfig
-from transformers.modeling_outputs import BaseModelOutput, Seq2SeqLMOutput
 from transformers.modeling_utils import PreTrainedModel
 from transformers.models.vision_encoder_decoder.configuration_vision_encoder_decoder import \
     VisionEncoderDecoderConfig
@@ -21,10 +21,6 @@ class CvtWithProjectionHeadConfig(transformers.CvtConfig):
         self.projection_size = projection_size
-class ModelOutputWithProjectionEmbedding(transformers.modeling_outputs.ModelOutput):
-    last_hidden_state: torch.FloatTensor
 class CvtProjectionHead(torch.nn.Module):
     def __init__(self, config) -> None:
@@ -58,7 +54,7 @@ class CvtWithProjectionHead(transformers.CvtPreTrainedModel):
         pixel_values: Optional[torch.Tensor] = None,
         output_hidden_states: Optional[bool] = None,
         return_dict: Optional[bool] = None,
-    ) -> Union[Tuple, ModelOutputWithProjectionEmbedding]:
         return_dict = return_dict if return_dict is not None else self.config.use_return_dict
@@ -75,7 +71,7 @@ class CvtWithProjectionHead(transformers.CvtPreTrainedModel):
         if not return_dict:
             return projection
-        return ModelOutputWithProjectionEmbedding(
             last_hidden_state=projection,
         )

 from torch.nn import CrossEntropyLoss
 from transformers import PreTrainedTokenizerFast, VisionEncoderDecoderModel
 from transformers.configuration_utils import PretrainedConfig
+from transformers.modeling_outputs import BaseModelOutput, ModelOutput, Seq2SeqLMOutput
 from transformers.modeling_utils import PreTrainedModel
 from transformers.models.vision_encoder_decoder.configuration_vision_encoder_decoder import \
     VisionEncoderDecoderConfig
         self.projection_size = projection_size
 class CvtProjectionHead(torch.nn.Module):
     def __init__(self, config) -> None:
         pixel_values: Optional[torch.Tensor] = None,
         output_hidden_states: Optional[bool] = None,
         return_dict: Optional[bool] = None,
+    ) -> Union[Tuple, ModelOutput]:
         return_dict = return_dict if return_dict is not None else self.config.use_return_dict
         if not return_dict:
             return projection
+        return ModelOutput(
             last_hidden_state=projection,
         )