Upload tokenizer

Files changed (2) hide show

special_tokens_map.json CHANGED Viewed

@@ -1,4 +1,16 @@
 {
-  "pad_token": "2",
-  "unk_token": "<unk>"
 }

 {
+  "pad_token": {
+    "content": "2",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
 }

tokenizer_config.json CHANGED Viewed

@@ -20,7 +20,7 @@
   },
   "clean_up_tokenization_spaces": true,
   "is_uroman": false,
-  "language": "swh",
   "model_max_length": 1000000000000000019884624838656,
   "normalize": true,
   "pad_token": "2",

   },
   "clean_up_tokenization_spaces": true,
   "is_uroman": false,
+  "language": "lin",
   "model_max_length": 1000000000000000019884624838656,
   "normalize": true,
   "pad_token": "2",