Training in progress, step 500

Files changed (4) hide show

config.json CHANGED Viewed

@@ -1,49 +1,23 @@
 {
-  "_name_or_path": "madlag/bert-large-uncased-whole-word-masking-finetuned-squadv2",
   "architectures": [
     "BertForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
-  "hidden_size": 1024,
   "initializer_range": 0.02,
-  "intermediate_size": 4096,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,
   "model_type": "bert",
-  "num_attention_heads": 16,
-  "num_hidden_layers": 24,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
-  "pruned_heads": {
-    "0": [],
-    "1": [],
-    "2": [],
-    "3": [],
-    "4": [],
-    "5": [],
-    "6": [],
-    "7": [],
-    "8": [],
-    "9": [],
-    "10": [],
-    "11": [],
-    "12": [],
-    "13": [],
-    "14": [],
-    "15": [],
-    "16": [],
-    "17": [],
-    "18": [],
-    "19": [],
-    "20": [],
-    "21": [],
-    "22": [],
-    "23": []
-  },
   "torch_dtype": "float32",
   "transformers_version": "4.33.1",
   "type_vocab_size": 2,

 {
+  "_name_or_path": "twmkn9/bert-base-uncased-squad2",
   "architectures": [
     "BertForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
   "initializer_range": 0.02,
+  "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,
   "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
   "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
   "transformers_version": "4.33.1",
   "type_vocab_size": 2,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:78a930ef483a3c52fa91d5a888401a48d151255b8d932edbffa6ecf4b9570aa6
-size 1336507113

 version https://git-lfs.github.com/spec/v1
+oid sha256:2111b4a7a3b87bb294ba93d83be4feb1598611b9a4193d86577487470a9f37f8
+size 435923225

tokenizer_config.json CHANGED Viewed

@@ -4,6 +4,7 @@
   "do_basic_tokenize": true,
   "do_lower_case": true,
   "mask_token": "[MASK]",
   "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",

   "do_basic_tokenize": true,
   "do_lower_case": true,
   "mask_token": "[MASK]",
+  "max_len": 512,
   "model_max_length": 512,
   "never_split": null,
   "pad_token": "[PAD]",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a778c5de8261f8bbf2a4753f03db001b1b26551a783840cfff10f28e9cb6220b
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:56352738505dbfee5845ddcb4f6d57b1e635c3a8525bad0be88b913cbd883135
 size 4091