lambdavi
/

span-marker-luke-base-conll2003

Token Classification

named-entity-recognition

generated_from_span_marker_trainer

Eval Results (legacy)

Model card Files Files and versions

lambdavi commited on Jan 9, 2024

Commit

65af14f

·

1 Parent(s): d1e1c14

Upload tokenizer

Files changed (2) hide show

tokenizer.json +18 -4
tokenizer_config.json +1 -1

tokenizer.json CHANGED Viewed

@@ -1,7 +1,21 @@
 {
   "version": "1.0",
-  "truncation": null,
-  "padding": null,
   "added_tokens": [
     {
       "id": 0,
@@ -70,7 +84,7 @@
   "normalizer": null,
   "pre_tokenizer": {
     "type": "ByteLevel",
-    "add_prefix_space": false,
     "trim_offsets": true,
     "use_regex": true
   },
@@ -85,7 +99,7 @@
       0
     ],
     "trim_offsets": true,
-    "add_prefix_space": false
   },
   "decoder": {
     "type": "ByteLevel",

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 512,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
+  "padding": {
+    "strategy": {
+      "Fixed": 512
+    },
+    "direction": "Right",
+    "pad_to_multiple_of": null,
+    "pad_id": 1,
+    "pad_type_id": 0,
+    "pad_token": "<pad>"
+  },
   "added_tokens": [
     {
       "id": 0,
   "normalizer": null,
   "pre_tokenizer": {
     "type": "ByteLevel",
+    "add_prefix_space": true,
     "trim_offsets": true,
     "use_regex": true
   },
       0
     ],
     "trim_offsets": true,
+    "add_prefix_space": true
   },
   "decoder": {
     "type": "ByteLevel",

tokenizer_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "add_prefix_space": false,
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",

 {
+  "add_prefix_space": true,
   "added_tokens_decoder": {
     "0": {
       "content": "<s>",