kadasterdst
/

querygenerator

text2text-generation

generated_from_keras_callback

text-generation-inference

Model card Files Files and versions

Wimflorijn commited on Feb 9, 2025

Commit

df85935

·

verified ·

1 Parent(s): aca99c3

Upload tokenizer

Files changed (2) hide show

tokenizer.json +4 -2
tokenizer_config.json +2 -0

tokenizer.json CHANGED Viewed

@@ -1023,7 +1023,8 @@
       {
         "type": "Metaspace",
         "replacement": "▁",
-        "add_prefix_space": true
       },
       {
         "type": "Digits",
@@ -1080,7 +1081,8 @@
   "decoder": {
     "type": "Metaspace",
     "replacement": "▁",
-    "add_prefix_space": true
   },
   "model": {
     "type": "Unigram",

       {
         "type": "Metaspace",
         "replacement": "▁",
+        "prepend_scheme": "always",
+        "split": true
       },
       {
         "type": "Digits",
   "decoder": {
     "type": "Metaspace",
     "replacement": "▁",
+    "prepend_scheme": "always",
+    "split": true
   },
   "model": {
     "type": "Unigram",

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",
@@ -987,6 +988,7 @@
   "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "extra_ids": 100,
   "max_length": 1024,
   "model_max_length": 1000000000000000019884624838656,
   "pad_to_multiple_of": null,

 {
+  "add_prefix_space": null,
   "added_tokens_decoder": {
     "0": {
       "content": "<pad>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "</s>",
   "extra_ids": 100,
+  "extra_special_tokens": {},
   "max_length": 1024,
   "model_max_length": 1000000000000000019884624838656,
   "pad_to_multiple_of": null,