mixamrepijey
/

chonk-code

Text Generation

text-generation-inference

Model card Files Files and versions

mixamrepijey commited on Feb 1, 2024

Commit

772c71d

·

verified ·

1 Parent(s): d09c005

Upload tokenizer

Files changed (1) hide show

tokenizer_config.json +7 -9

tokenizer_config.json CHANGED Viewed

@@ -60,6 +60,10 @@
     }
   },
   "additional_special_tokens": [
     "▁<PRE>",
     "▁<MID>",
     "▁<SUF>",
@@ -87,18 +91,12 @@
   "legacy": null,
   "middle_token": "▁<MID>",
   "model_max_length": 4096,
-  "pad_token": {
-    "__type": "AddedToken",
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": true,
-    "rstrip": false,
-    "single_word": false
-  },
   "prefix_token": "▁<PRE>",
   "sp_model_kwargs": {},
   "suffix_token": "▁<SUF>",
-  "tokenizer_class": "LlamaTokenizer",
   "unk_token": {
     "__type": "AddedToken",
     "content": "<unk>",

     }
   },
   "additional_special_tokens": [
+    "▁<PRE>",
+    "▁<MID>",
+    "▁<SUF>",
+    "▁<EOT>",
     "▁<PRE>",
     "▁<MID>",
     "▁<SUF>",
   "legacy": null,
   "middle_token": "▁<MID>",
   "model_max_length": 4096,
+  "pad_token": "</s>",
   "prefix_token": "▁<PRE>",
   "sp_model_kwargs": {},
+  "suffix_first": false,
   "suffix_token": "▁<SUF>",
+  "tokenizer_class": "CodeLlamaTokenizer",
   "unk_token": {
     "__type": "AddedToken",
     "content": "<unk>",