Upload 5 files

Browse files

Files changed (5) hide show

ckpt_iter100000.pt +3 -0
tokenizer/special_tokens_map.json +4 -0
tokenizer/tokenizer.json +89 -0
tokenizer/tokenizer_config.json +18 -0
vocab.json +63 -0

ckpt_iter100000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:707aebe88e348bed4f12e7156b3d9f3460c244872fb3d70f0d4ddc56d9d5d05f
+size 306736861

tokenizer/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "pad_token": "<pad>",
+  "unk_token": "<pad>"
+}

tokenizer/tokenizer.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+  "version": "1.0",
+  "truncation": null,
+  "padding": null,
+  "added_tokens": [
+    {
+      "id": 0,
+      "content": "<pad>",
+      "single_word": false,
+      "lstrip": false,
+      "rstrip": false,
+      "normalized": false,
+      "special": true
+    }
+  ],
+  "normalizer": null,
+  "pre_tokenizer": {
+    "type": "Whitespace"
+  },
+  "post_processor": null,
+  "decoder": null,
+  "model": {
+    "type": "WordLevel",
+    "vocab": {
+      "<pad>": 0,
+      "a1": 1,
+      "a2": 2,
+      "a3": 3,
+      "a4": 4,
+      "a5": 5,
+      "a6": 6,
+      "a7": 7,
+      "a8": 8,
+      "b1": 9,
+      "b2": 10,
+      "b3": 11,
+      "b4": 12,
+      "b5": 13,
+      "b6": 14,
+      "b7": 15,
+      "b8": 16,
+      "c1": 17,
+      "c2": 18,
+      "c3": 19,
+      "c4": 20,
+      "c5": 21,
+      "c6": 22,
+      "c7": 23,
+      "c8": 24,
+      "d1": 25,
+      "d2": 26,
+      "d3": 27,
+      "d6": 28,
+      "d7": 29,
+      "d8": 30,
+      "e1": 31,
+      "e2": 32,
+      "e3": 33,
+      "e6": 34,
+      "e7": 35,
+      "e8": 36,
+      "f1": 37,
+      "f2": 38,
+      "f3": 39,
+      "f4": 40,
+      "f5": 41,
+      "f6": 42,
+      "f7": 43,
+      "f8": 44,
+      "g1": 45,
+      "g2": 46,
+      "g3": 47,
+      "g4": 48,
+      "g5": 49,
+      "g6": 50,
+      "g7": 51,
+      "g8": 52,
+      "h1": 53,
+      "h2": 54,
+      "h3": 55,
+      "h4": 56,
+      "h5": 57,
+      "h6": 58,
+      "h7": 59,
+      "h8": 60
+    },
+    "unk_token": "<pad>"
+  }
+}

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<pad>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": false,
+  "extra_special_tokens": {},
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<pad>",
+  "tokenizer_class": "PreTrainedTokenizerFast",
+  "unk_token": "<pad>"
+}

vocab.json ADDED Viewed

	@@ -0,0 +1,63 @@

+{
+  "<pad>": 0,
+  "a1": 1,
+  "a2": 2,
+  "a3": 3,
+  "a4": 4,
+  "a5": 5,
+  "a6": 6,
+  "a7": 7,
+  "a8": 8,
+  "b1": 9,
+  "b2": 10,
+  "b3": 11,
+  "b4": 12,
+  "b5": 13,
+  "b6": 14,
+  "b7": 15,
+  "b8": 16,
+  "c1": 17,
+  "c2": 18,
+  "c3": 19,
+  "c4": 20,
+  "c5": 21,
+  "c6": 22,
+  "c7": 23,
+  "c8": 24,
+  "d1": 25,
+  "d2": 26,
+  "d3": 27,
+  "d6": 28,
+  "d7": 29,
+  "d8": 30,
+  "e1": 31,
+  "e2": 32,
+  "e3": 33,
+  "e6": 34,
+  "e7": 35,
+  "e8": 36,
+  "f1": 37,
+  "f2": 38,
+  "f3": 39,
+  "f4": 40,
+  "f5": 41,
+  "f6": 42,
+  "f7": 43,
+  "f8": 44,
+  "g1": 45,
+  "g2": 46,
+  "g3": 47,
+  "g4": 48,
+  "g5": 49,
+  "g6": 50,
+  "g7": 51,
+  "g8": 52,
+  "h1": 53,
+  "h2": 54,
+  "h3": 55,
+  "h4": 56,
+  "h5": 57,
+  "h6": 58,
+  "h7": 59,
+  "h8": 60
+}