DINGDINGBELLS
/

HighCloud

Model card Files Files and versions

DINGDINGBELLS commited on 11 days ago

Commit

357e238

·

verified ·

1 Parent(s): 32412c1

Update tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +14 -4

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,19 @@
 {
   "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
-  "unk_token": "<|endoftext|>",
   "pad_token": "[PAD]",
-  "add_prefix_space": false,
-  "model_type": "gpt2",
-  "tokenizer_class": "GPT2Tokenizer"
 }

 {
+  "add_bos_token": true,
+  "add_eos_token": false,
   "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
+  "model_max_length": 2048,
   "pad_token": "[PAD]",
+  "tokenizer_class": "GPT2Tokenizer",
+  "additional_special_tokens": [
+    "<|vision_16|>",
+    "<|logic_32|>",
+    "<|lang_ru|>",
+    "<|lang_en|>",
+    "<|lang_ua|>",
+    "<|lang_by|>"
+  ],
+  "chat_template": "{% for message in messages %}{{'<|im_start|>' + message['role'] + '\\n' + message['content'] + '<|im_end|>' + '\\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\\n' }}{% endif %}"
 }