previous model

Files changed (8) hide show

config.json CHANGED Viewed

@@ -4,27 +4,24 @@
     "LayoutLMForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
-  "bos_token_id": 0,
   "classifier_dropout": null,
-  "eos_token_id": 2,
-  "gradient_checkpointing": false,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
-  "layer_norm_eps": 1e-05,
   "max_2d_position_embeddings": 1024,
-  "max_position_embeddings": 514,
-  "model_type": "roberta",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
-  "pad_token_id": 1,
   "position_embedding_type": "absolute",
-  "tokenizer_class": "RobertaTokenizer",
   "torch_dtype": "float32",
   "transformers_version": "4.23.1",
   "type_vocab_size": 2,
   "use_cache": true,
-  "vocab_size": 50265
 }

     "LayoutLMForQuestionAnswering"
   ],
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "hidden_act": "gelu",
   "hidden_dropout_prob": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
+  "layer_norm_eps": 1e-12,
   "max_2d_position_embeddings": 1024,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 0,
   "position_embedding_type": "absolute",
   "torch_dtype": "float32",
   "transformers_version": "4.23.1",
   "type_vocab_size": 2,
   "use_cache": true,
+  "vocab_size": 30522
 }

merges.txt DELETED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a112fb3f782ff14965f87e1916c2557de365b2827fd2fb3c7ebfe26773c3631
-size 1438367461

 version https://git-lfs.github.com/spec/v1
+oid sha256:cfc74f8966780254bf142a3eb13696b432812aa8fffbaa21340460090b8c51c2
+size 1357491877

special_tokens_map.json CHANGED Viewed

@@ -1,15 +1,7 @@
 {
-  "bos_token": "<s>",
-  "cls_token": "<s>",
-  "eos_token": "</s>",
-  "mask_token": {
-    "content": "<mask>",
-    "lstrip": true,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": "<pad>",
-  "sep_token": "</s>",
-  "unk_token": "<unk>"
 }

 {
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
 }

tokenizer_config.json CHANGED Viewed

@@ -1,64 +1,16 @@
 {
-  "add_prefix_space": true,
-  "bos_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "cls_token": {
-    "__type": "AddedToken",
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "errors": "replace",
-  "mask_token": {
-    "__type": "AddedToken",
-    "content": "<mask>",
-    "lstrip": true,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "model_max_length": 512,
-  "name_or_path": "/content/docvqa/data/models",
-  "pad_token": {
-    "__type": "AddedToken",
-    "content": "<pad>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "sep_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
-  "special_tokens_map_file": null,
-  "tokenizer_class": "RobertaTokenizer",
-  "unk_token": {
-    "__type": "AddedToken",
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  }
 }

 {
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "max_len": 512,
+  "name_or_path": "microsoft/layoutlm-large-uncased",
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": "data/models/models--microsoft--layoutlm-large-uncased/snapshots/1e7d50dced3cdfea3a3d63c610e2aab36933dbef/special_tokens_map.json",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b6c73682deb5b30de71e4fd9245521002664b7f5f8d8809380a0ac11e52e5da7
 size 1583

 version https://git-lfs.github.com/spec/v1
+oid sha256:9518cb20ba30d0bc101127dbdfff2574f450d60c3031967b86272a24d6ee0123
 size 1583

vocab.json DELETED Viewed

The diff for this file is too large to render. See raw diff

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff