sujithatz
/

finbot-transofrmer-based-phi3.5

Text Generation

text-generation-inference

Model card Files Files and versions

sujithatz commited on Oct 21, 2024

Commit

9c093c9

·

verified ·

1 Parent(s): 357bf77

Upload tokenizer

Files changed (2) hide show

tokenizer.json +1 -29
tokenizer_config.json +3 -3

tokenizer.json CHANGED Viewed

@@ -155,12 +155,6 @@
           "id": "A",
           "type_id": 0
         }
-      },
-      {
-        "SpecialToken": {
-          "id": "<|endoftext|>",
-          "type_id": 0
-        }
       }
     ],
     "pair": [
@@ -170,36 +164,14 @@
           "type_id": 0
         }
       },
-      {
-        "SpecialToken": {
-          "id": "<|endoftext|>",
-          "type_id": 0
-        }
-      },
       {
         "Sequence": {
           "id": "B",
           "type_id": 1
         }
-      },
-      {
-        "SpecialToken": {
-          "id": "<|endoftext|>",
-          "type_id": 1
-        }
       }
     ],
-    "special_tokens": {
-      "<|endoftext|>": {
-        "id": "<|endoftext|>",
-        "ids": [
-          32000
-        ],
-        "tokens": [
-          "<|endoftext|>"
-        ]
-      }
-    }
   },
   "decoder": {
     "type": "Sequence",

           "id": "A",
           "type_id": 0
         }
       }
     ],
     "pair": [
           "type_id": 0
         }
       },
       {
         "Sequence": {
           "id": "B",
           "type_id": 1
         }
       }
     ],
+    "special_tokens": {}
   },
   "decoder": {
     "type": "Sequence",

tokenizer_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "add_bos_token": false,
-  "add_eos_token": true,
   "add_prefix_space": null,
   "added_tokens_decoder": {
     "0": {
@@ -121,9 +121,9 @@
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "legacy": false,
-  "model_max_length": 131072,
   "pad_token": "<unk>",
-  "padding_side": "left",
   "sp_model_kwargs": {},
   "tokenizer_class": "LlamaTokenizer",
   "unk_token": "<unk>",

 {
   "add_bos_token": false,
+  "add_eos_token": false,
   "add_prefix_space": null,
   "added_tokens_decoder": {
     "0": {
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "legacy": false,
+  "model_max_length": 300,
   "pad_token": "<unk>",
+  "padding_side": "right",
   "sp_model_kwargs": {},
   "tokenizer_class": "LlamaTokenizer",
   "unk_token": "<unk>",