Add files using upload-large-folder tool

Files changed (4) hide show

added_tokens.json CHANGED Viewed

@@ -9,6 +9,5 @@
   "<|tool_response|>": 200027,
   "<|tool|>": 200023,
   "<|user|>": 200021,
-  "<｜PAD▁TOKEN｜>": 200030,
-  "�": 200029
 }

   "<|tool_response|>": 200027,
   "<|tool|>": 200023,
   "<|user|>": 200021,
+  "<｜PAD▁TOKEN｜>": 200029
 }

special_tokens_map.json CHANGED Viewed

@@ -14,5 +14,5 @@
     "single_word": false
   },
   "pad_token": "<｜PAD▁TOKEN｜>",
-  "unk_token": "�"
 }

     "single_word": false
   },
   "pad_token": "<｜PAD▁TOKEN｜>",
+  "unk_token": "ï¿½"
 }

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:085a99d5283b36631e74138d06b87d31eb024dd2f96f89145690edbba94cadd7
-size 15524471

 version https://git-lfs.github.com/spec/v1
+oid sha256:37b10016a39382ff2d24acc20a291ed83243a26c4549ab01f6240e72c6291d56
+size 15524472

tokenizer_config.json CHANGED Viewed

@@ -3,6 +3,14 @@
   "add_eos_token": false,
   "add_prefix_space": false,
   "added_tokens_decoder": {
     "199999": {
       "content": "<|endoftext|>",
       "lstrip": false,
@@ -100,14 +108,6 @@
       "special": true
     },
     "200029": {
-      "content": "�",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "200030": {
       "content": "<｜PAD▁TOKEN｜>",
       "lstrip": false,
       "normalized": false,
@@ -117,7 +117,7 @@
     }
   },
   "bos_token": "<|endoftext|>",
-  "chat_template": "{% for message in messages %}{% if message['role'] == 'system' and 'tools' in message and message['tools'] is not none %}{{ '<|' + message['role'] + '|>' + message['content'] + '<|tool|>' + message['tools'] + '<|/tool|>' + '<|end|>' }}{% else %}{{ '<|' + message['role'] + '|>' + message['content'] + '<|end|>' }}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ '<|assistant|>' }}{% else %}{{ eos_token }}{% endif %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "extra_special_tokens": {},
@@ -125,5 +125,5 @@
   "pad_token": "<｜PAD▁TOKEN｜>",
   "padding_side": "left",
   "tokenizer_class": "GPT2Tokenizer",
-  "unk_token": "�"
 }

   "add_eos_token": false,
   "add_prefix_space": false,
   "added_tokens_decoder": {
+    "3251": {
+      "content": "ï¿½",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
     "199999": {
       "content": "<|endoftext|>",
       "lstrip": false,
       "special": true
     },
     "200029": {
       "content": "<｜PAD▁TOKEN｜>",
       "lstrip": false,
       "normalized": false,
     }
   },
   "bos_token": "<|endoftext|>",
+  "chat_template": "{% for message in messages %}{% if message['role'] == 'system' and 'tools' in message and message['tools'] is not none %}{{ '<|' + message['role'] + '|>' + message['content'] + '<|tool|>' + message['tools'] + '<|/tool|>' + '<|end|>' }}{% else %}{{ '<|' + message['role'] + '|>' + message['content'] + '<|end|>' }}{% endif %}{% endfor %}{% if add_generation_prompt %}{{ '<|assistant|>' }}{% endif %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "extra_special_tokens": {},
   "pad_token": "<｜PAD▁TOKEN｜>",
   "padding_side": "left",
   "tokenizer_class": "GPT2Tokenizer",
+  "unk_token": "ï¿½"
 }