minpeter
/

tiny-ko-base

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a36c3ff5b839a44b064837a12b832e61cab245c31d1618d03c85d1314cc07911
-size 2846439

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f24e35414c22e483b892df074f22186bcbfd1b1c1f183ef4c8f4990f826ff30
+size 2869924

tokenizer_config.json CHANGED Viewed

@@ -1,143 +1,143 @@
 {
   "added_tokens_decoder": {
-    "0": {
-      "content": "<|unk_token|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "1": {
-      "content": "<|pad_token|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "2": {
-      "content": "<|im_start|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "3": {
-      "content": "<|im_end|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "4": {
       "content": "<tool_call>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     },
-    "5": {
       "content": "</tool_call>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     },
-    "6": {
       "content": "<think>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     },
-    "7": {
       "content": "</think>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": true
     },
-    "8": {
-      "content": "<|unused_token_0|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "9": {
-      "content": "<|unused_token_1|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "10": {
-      "content": "<|unused_token_2|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "11": {
-      "content": "<|unused_token_3|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "12": {
-      "content": "<|unused_token_4|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "13": {
-      "content": "<|unused_token_5|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "14": {
-      "content": "<|unused_token_6|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "15": {
-      "content": "<|unused_token_7|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "16": {
-      "content": "<|unused_token_8|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
-    "17": {
-      "content": "<|unused_token_9|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -148,7 +148,7 @@
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|im_end|>",
   "extra_special_tokens": {},
-  "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<|pad_token|>",
   "tokenizer_class": "PreTrainedTokenizer",
   "unk_token": "<|unk_token|>"

 {
   "added_tokens_decoder": {
+    "32000": {
+      "content": "<|im_start|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32001": {
+      "content": "<|im_end|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32002": {
+      "content": "<|unk_token|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32003": {
+      "content": "<|pad_token|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32004": {
       "content": "<tool_call>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": false
     },
+    "32005": {
       "content": "</tool_call>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": false
     },
+    "32006": {
       "content": "<think>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": false
     },
+    "32007": {
       "content": "</think>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": false
     },
+    "32008": {
+      "content": "<|unused_special_token_0|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32009": {
+      "content": "<|unused_special_token_1|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32010": {
+      "content": "<|unused_special_token_2|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32011": {
+      "content": "<|unused_special_token_3|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32012": {
+      "content": "<|unused_special_token_4|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32013": {
+      "content": "<|unused_special_token_5|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32014": {
+      "content": "<|unused_special_token_6|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32015": {
+      "content": "<|unused_special_token_7|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32016": {
+      "content": "<|unused_special_token_8|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "single_word": false,
       "special": true
     },
+    "32017": {
+      "content": "<|unused_special_token_9|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|im_end|>",
   "extra_special_tokens": {},
+  "model_max_length": 4096,
   "pad_token": "<|pad_token|>",
   "tokenizer_class": "PreTrainedTokenizer",
   "unk_token": "<|unk_token|>"