Training in progress, step 500

Browse files

Files changed (3) hide show

config.json +30 -3
model.safetensors +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,4 @@
 {
-  "_name_or_path": "OFA-Sys/chinese-clip-vit-base-patch16",
   "architectures": [
     "ChineseCLIPDualTextModel"
   ],
@@ -13,23 +12,51 @@
     "architectures": [
       "ChineseCLIPTextModel"
     ],
     "bos_token_id": 0,
     "directionality": "bidi",
     "eos_token_id": 2,
     "model_type": "chinese_clip_text_model",
     "output_past": true,
     "pooler_fc_size": 768,
     "pooler_num_attention_heads": 12,
     "pooler_num_fc_layers": 3,
     "pooler_size_per_head": 128,
     "pooler_type": "first_token_transform",
     "vocab_size": 21128
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.48.2",
   "vision_config": {
     "dropout": 0.0,
     "model_type": "chinese_clip_vision_model",
-    "patch_size": 16
   }
 }

 {
   "architectures": [
     "ChineseCLIPDualTextModel"
   ],
     "architectures": [
       "ChineseCLIPTextModel"
     ],
+    "attention_probs_dropout_prob": 0.1,
     "bos_token_id": 0,
     "directionality": "bidi",
     "eos_token_id": 2,
+    "hidden_act": "gelu",
+    "hidden_dropout_prob": 0.1,
+    "hidden_size": 768,
+    "initializer_factor": 1.0,
+    "initializer_range": 0.02,
+    "intermediate_size": 3072,
+    "layer_norm_eps": 1e-12,
+    "max_position_embeddings": 512,
     "model_type": "chinese_clip_text_model",
+    "num_attention_heads": 12,
+    "num_hidden_layers": 12,
     "output_past": true,
     "pooler_fc_size": 768,
     "pooler_num_attention_heads": 12,
     "pooler_num_fc_layers": 3,
     "pooler_size_per_head": 128,
     "pooler_type": "first_token_transform",
+    "position_embedding_type": "absolute",
+    "torch_dtype": "float32",
+    "type_vocab_size": 2,
+    "use_cache": true,
     "vocab_size": 21128
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.50.0",
   "vision_config": {
+    "attention_dropout": 0.0,
     "dropout": 0.0,
+    "hidden_act": "quick_gelu",
+    "hidden_size": 768,
+    "image_size": 224,
+    "initializer_factor": 1.0,
+    "initializer_range": 0.02,
+    "intermediate_size": 3072,
+    "layer_norm_eps": 1e-05,
     "model_type": "chinese_clip_vision_model",
+    "num_attention_heads": 12,
+    "num_channels": 3,
+    "num_hidden_layers": 12,
+    "patch_size": 16,
+    "projection_dim": 512,
+    "torch_dtype": "float32"
   }
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bdcd054ea9419ee5f703feb18bb6003e21820ab1a7ff8a7718428974c789d0b1
 size 816611916

 version https://git-lfs.github.com/spec/v1
+oid sha256:11f909873fdc7838e11fe9c30fbf3ec74b19eb1dfe4298dfe4f3d25f367904cd
 size 816611916

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:72f359aff32fcb3d038f1a3bd375f954101277f49d0da22aba9acda851f6fdb5
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:4760b48d8ca9c7295e9f6fad0a7c66c199044ff324849da0a9b7b1b7b12dce6a
 size 5368