Upload 8 files

Files changed (3) hide show

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -1,11 +1,12 @@
 {
-  "tokenizer_class": "PreTrainedTokenizerFast",
   "tokenizer_file": "tokenizer.json",
   "model_max_length": 1024,
   "add_prefix_space": true,
   "clean_up_tokenization_spaces": false,
   "bos_token": "<|begin_of_text|>",
   "eos_token": "<|eot_id|>",
   "pad_token": "<|pad|>",
   "unk_token": "<|unk|>",
   "additional_special_tokens": [

 {
+  "tokenizer_class": "GPT2TokenizerFast",
   "tokenizer_file": "tokenizer.json",
   "model_max_length": 1024,
   "add_prefix_space": true,
   "clean_up_tokenization_spaces": false,
   "bos_token": "<|begin_of_text|>",
   "eos_token": "<|eot_id|>",
+  "eot_token": "<|eot_id|>",
   "pad_token": "<|pad|>",
   "unk_token": "<|unk|>",
   "additional_special_tokens": [

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff