{ "version": "1.0", "truncation": null, "padding": null, "added_tokens": [ { "id": 0, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 1, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 2, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true } ], "normalizer": { "type": "NFC" }, "pre_tokenizer": { "type": "Sequence", "pretokenizers": [ { "type": "Split", "pattern": { "Regex": "[+=]|[^\\S\\r\\n]*[\\n\\r]+|[^\\S\\r\\n]+" }, "behavior": "Isolated", "invert": false }, { "type": "Split", "pattern": { "Regex": "\\p{N}{1,3}" }, "behavior": "Isolated", "invert": false }, { "type": "ByteLevel", "add_prefix_space": false, "trim_offsets": true, "use_regex": false } ] }, "post_processor": null, "decoder": { "type": "ByteLevel", "add_prefix_space": true, "trim_offsets": true, "use_regex": true }, "model": { "type": "BPE", "dropout": null, "unk_token": null, "continuing_subword_prefix": null, "end_of_word_suffix": null, "fuse_unk": false, "byte_fallback": false, "ignore_merges": false, "vocab": { "": 0, "": 1, "": 2, "!": 3, "\"": 4, "#": 5, "$": 6, "%": 7, "&": 8, "'": 9, "(": 10, ")": 11, "*": 12, "+": 13, ",": 14, "-": 15, ".": 16, "/": 17, "0": 18, "1": 19, "2": 20, "3": 21, "4": 22, "5": 23, "6": 24, "7": 25, "8": 26, "9": 27, ":": 28, ";": 29, "<": 30, "=": 31, ">": 32, "?": 33, "@": 34, "A": 35, "B": 36, "C": 37, "D": 38, "E": 39, "F": 40, "G": 41, "H": 42, "I": 43, "J": 44, "K": 45, "L": 46, "M": 47, "N": 48, "O": 49, "P": 50, "Q": 51, "R": 52, "S": 53, "T": 54, "U": 55, "V": 56, "W": 57, "X": 58, "Y": 59, "Z": 60, "[": 61, "\\": 62, "]": 63, "^": 64, "_": 65, "`": 66, "a": 67, "b": 68, "c": 69, "d": 70, "e": 71, "f": 72, "g": 73, "h": 74, "i": 75, "j": 76, "k": 77, "l": 78, "m": 79, "n": 80, "o": 81, "p": 82, "q": 83, "r": 84, "s": 85, "t": 86, "u": 87, "v": 88, "w": 89, "x": 90, "y": 91, "z": 92, "{": 93, "|": 94, "}": 95, "~": 96, "¡": 97, "¢": 98, "£": 99, "¤": 100, "¥": 101, "¦": 102, "§": 103, "¨": 104, "©": 105, "ª": 106, "«": 107, "¬": 108, "®": 109, "¯": 110, "°": 111, "±": 112, "²": 113, "³": 114, "´": 115, "µ": 116, "¶": 117, "·": 118, "¸": 119, "¹": 120, "º": 121, "»": 122, "¼": 123, "½": 124, "¾": 125, "¿": 126, "À": 127, "Á": 128, "Â": 129, "Ã": 130, "Ä": 131, "Å": 132, "Æ": 133, "Ç": 134, "È": 135, "É": 136, "Ê": 137, "Ë": 138, "Ì": 139, "Í": 140, "Î": 141, "Ï": 142, "Ð": 143, "Ñ": 144, "Ò": 145, "Ó": 146, "Ô": 147, "Õ": 148, "Ö": 149, "×": 150, "Ø": 151, "Ù": 152, "Ú": 153, "Û": 154, "Ü": 155, "Ý": 156, "Þ": 157, "ß": 158, "à": 159, "á": 160, "â": 161, "ã": 162, "ä": 163, "å": 164, "æ": 165, "ç": 166, "è": 167, "é": 168, "ê": 169, "ë": 170, "ì": 171, "í": 172, "î": 173, "ï": 174, "ð": 175, "ñ": 176, "ò": 177, "ó": 178, "ô": 179, "õ": 180, "ö": 181, "÷": 182, "ø": 183, "ù": 184, "ú": 185, "û": 186, "ü": 187, "ý": 188, "þ": 189, "ÿ": 190, "Ā": 191, "ā": 192, "Ă": 193, "ă": 194, "Ą": 195, "ą": 196, "Ć": 197, "ć": 198, "Ĉ": 199, "ĉ": 200, "Ċ": 201, "ċ": 202, "Č": 203, "č": 204, "Ď": 205, "ď": 206, "Đ": 207, "đ": 208, "Ē": 209, "ē": 210, "Ĕ": 211, "ĕ": 212, "Ė": 213, "ė": 214, "Ę": 215, "ę": 216, "Ě": 217, "ě": 218, "Ĝ": 219, "ĝ": 220, "Ğ": 221, "ğ": 222, "Ġ": 223, "ġ": 224, "Ģ": 225, "ģ": 226, "Ĥ": 227, "ĥ": 228, "Ħ": 229, "ħ": 230, "Ĩ": 231, "ĩ": 232, "Ī": 233, "ī": 234, "Ĭ": 235, "ĭ": 236, "Į": 237, "į": 238, "İ": 239, "ı": 240, "IJ": 241, "ij": 242, "Ĵ": 243, "ĵ": 244, "Ķ": 245, "ķ": 246, "ĸ": 247, "Ĺ": 248, "ĺ": 249, "Ļ": 250, "ļ": 251, "Ľ": 252, "ľ": 253, "Ŀ": 254, "ŀ": 255, "Ł": 256, "ł": 257, "Ń": 258, "og": 259, "re": 260, "red": 261, "nd": 262, "hu": 263, "rede": 264, "ndrede": 265, "hundrede": 266, "tt": 267, "lv": 268, "alv": 269, "em": 270, "fem": 271, "halv": 272, "tred": 273, "fi": 274, "yv": 275, "oghalv": 276, "tte": 277, "ek": 278, "ni": 279, "sek": 280, "to": 281, "tre": 282, "treds": 283, "seks": 284, "otte": 285, "syv": 286, "fire": 287, "ett": 288, "ind": 289, "sind": 290, "usind": 291, "ettusind": 292, "ettusinde": 293, "en": 294, "et": 295, "fj": 296, "ve": 297, "ds": 298, "er": 299, "fy": 300, "ive": 301, "rs": 302, "rre": 303, "tyv": 304, "fems": 305, "femhundrede": 306, "tredive": 307, "firs": 308, "nihundrede": 309, "tohundrede": 310, "trehundrede": 311, "sekshundrede": 312, "ottehundrede": 313, "syvhundrede": 314, "firehundrede": 315, "ethundrede": 316, "fjer": 317, "fyrre": 318, "tyve": 319, "fjerds": 320, "ogtreds": 321, "ogtredive": 322, "ogfirs": 323, "ogfyrre": 324, "ogtyve": 325, "oghalvtreds": 326, "oghalvfems": 327, "oghalvfjerds": 328, "tten": 329, "ten": 330, "atten": 331, "el": 332, "eve": 333, "leve": 334, "or": 335, "sy": 336, "ti": 337, "femogtreds": 338, "femogtredive": 339, "femogfirs": 340, "femogfyrre": 341, "femogtyve": 342, "femoghalvtreds": 343, "femoghalvfems": 344, "femoghalvfjerds": 345, "femten": 346, "halvtreds": 347, "halvfems": 348, "halvfjerds": 349, "niogtreds": 350, "niogtredive": 351, "niogfirs": 352, "niogfyrre": 353, "niogtyve": 354, "nioghalvtreds": 355, "nioghalvfems": 356, "nioghalvfjerds": 357, "nitten": 358, "tolv": 359, "toogtreds": 360, "toogtredive": 361, "toogfirs": 362, "toogfyrre": 363, "toogtyve": 364, "tooghalvtreds": 365, "tooghalvfems": 366, "tooghalvfjerds": 367, "treogtreds": 368, "treogtredive": 369, "treogfirs": 370, "treogfyrre": 371, "treogtyve": 372, "treoghalvtreds": 373, "treoghalvfems": 374, "treoghalvfjerds": 375, "tretten": 376, "seksogtreds": 377, "seksogtredive": 378, "seksogfirs": 379, "seksogfyrre": 380, "seksogtyve": 381, "seksoghalvtreds": 382, "seksoghalvfems": 383, "seksoghalvfjerds": 384, "seksten": 385, "otteogtreds": 386, "otteogtredive": 387, "otteogfirs": 388, "otteogfyrre": 389, "otteogtyve": 390, "otteoghalvtreds": 391, "otteoghalvfems": 392, "otteoghalvfjerds": 393, "syvogtreds": 394, "syvogtredive": 395, "syvogfirs": 396, "syvogfyrre": 397, "syvogtyve": 398, "syvoghalvtreds": 399, "syvoghalvfems": 400, "syvoghalvfjerds": 401, "fireogtreds": 402, "fireogtredive": 403, "fireogfirs": 404, "fireogfyrre": 405, "fireogtyve": 406, "fireoghalvtreds": 407, "fireoghalvfems": 408, "fireoghalvfjerds": 409, "enogtreds": 410, "enogtredive": 411, "enogfirs": 412, "enogfyrre": 413, "enogtyve": 414, "enoghalvtreds": 415, "enoghalvfems": 416, "enoghalvfjerds": 417, "fjor": 418, "elleve": 419, "sytten": 420, "fjorten": 421, "nu": 422, "nul": 423 }, "merges": [ [ "o", "g" ], [ "r", "e" ], [ "re", "d" ], [ "n", "d" ], [ "h", "u" ], [ "red", "e" ], [ "nd", "rede" ], [ "hu", "ndrede" ], [ "t", "t" ], [ "l", "v" ], [ "a", "lv" ], [ "e", "m" ], [ "f", "em" ], [ "h", "alv" ], [ "t", "red" ], [ "f", "i" ], [ "y", "v" ], [ "og", "halv" ], [ "tt", "e" ], [ "e", "k" ], [ "n", "i" ], [ "s", "ek" ], [ "t", "o" ], [ "t", "re" ], [ "tred", "s" ], [ "sek", "s" ], [ "o", "tte" ], [ "s", "yv" ], [ "fi", "re" ], [ "e", "tt" ], [ "i", "nd" ], [ "s", "ind" ], [ "u", "sind" ], [ "ett", "usind" ], [ "ettusind", "e" ], [ "e", "n" ], [ "e", "t" ], [ "f", "j" ], [ "v", "e" ], [ "d", "s" ], [ "e", "r" ], [ "f", "y" ], [ "i", "ve" ], [ "r", "s" ], [ "r", "re" ], [ "t", "yv" ], [ "fem", "s" ], [ "fem", "hundrede" ], [ "tred", "ive" ], [ "fi", "rs" ], [ "ni", "hundrede" ], [ "to", "hundrede" ], [ "tre", "hundrede" ], [ "seks", "hundrede" ], [ "otte", "hundrede" ], [ "syv", "hundrede" ], [ "fire", "hundrede" ], [ "et", "hundrede" ], [ "fj", "er" ], [ "fy", "rre" ], [ "tyv", "e" ], [ "fjer", "ds" ], [ "og", "treds" ], [ "og", "tredive" ], [ "og", "firs" ], [ "og", "fyrre" ], [ "og", "tyve" ], [ "oghalv", "treds" ], [ "oghalv", "fems" ], [ "oghalv", "fjerds" ], [ "tte", "n" ], [ "t", "en" ], [ "a", "tten" ], [ "e", "l" ], [ "e", "ve" ], [ "l", "eve" ], [ "o", "r" ], [ "s", "y" ], [ "t", "i" ], [ "fem", "ogtreds" ], [ "fem", "ogtredive" ], [ "fem", "ogfirs" ], [ "fem", "ogfyrre" ], [ "fem", "ogtyve" ], [ "fem", "oghalvtreds" ], [ "fem", "oghalvfems" ], [ "fem", "oghalvfjerds" ], [ "fem", "ten" ], [ "halv", "treds" ], [ "halv", "fems" ], [ "halv", "fjerds" ], [ "ni", "ogtreds" ], [ "ni", "ogtredive" ], [ "ni", "ogfirs" ], [ "ni", "ogfyrre" ], [ "ni", "ogtyve" ], [ "ni", "oghalvtreds" ], [ "ni", "oghalvfems" ], [ "ni", "oghalvfjerds" ], [ "ni", "tten" ], [ "to", "lv" ], [ "to", "ogtreds" ], [ "to", "ogtredive" ], [ "to", "ogfirs" ], [ "to", "ogfyrre" ], [ "to", "ogtyve" ], [ "to", "oghalvtreds" ], [ "to", "oghalvfems" ], [ "to", "oghalvfjerds" ], [ "tre", "ogtreds" ], [ "tre", "ogtredive" ], [ "tre", "ogfirs" ], [ "tre", "ogfyrre" ], [ "tre", "ogtyve" ], [ "tre", "oghalvtreds" ], [ "tre", "oghalvfems" ], [ "tre", "oghalvfjerds" ], [ "tre", "tten" ], [ "seks", "ogtreds" ], [ "seks", "ogtredive" ], [ "seks", "ogfirs" ], [ "seks", "ogfyrre" ], [ "seks", "ogtyve" ], [ "seks", "oghalvtreds" ], [ "seks", "oghalvfems" ], [ "seks", "oghalvfjerds" ], [ "seks", "ten" ], [ "otte", "ogtreds" ], [ "otte", "ogtredive" ], [ "otte", "ogfirs" ], [ "otte", "ogfyrre" ], [ "otte", "ogtyve" ], [ "otte", "oghalvtreds" ], [ "otte", "oghalvfems" ], [ "otte", "oghalvfjerds" ], [ "syv", "ogtreds" ], [ "syv", "ogtredive" ], [ "syv", "ogfirs" ], [ "syv", "ogfyrre" ], [ "syv", "ogtyve" ], [ "syv", "oghalvtreds" ], [ "syv", "oghalvfems" ], [ "syv", "oghalvfjerds" ], [ "fire", "ogtreds" ], [ "fire", "ogtredive" ], [ "fire", "ogfirs" ], [ "fire", "ogfyrre" ], [ "fire", "ogtyve" ], [ "fire", "oghalvtreds" ], [ "fire", "oghalvfems" ], [ "fire", "oghalvfjerds" ], [ "en", "ogtreds" ], [ "en", "ogtredive" ], [ "en", "ogfirs" ], [ "en", "ogfyrre" ], [ "en", "ogtyve" ], [ "en", "oghalvtreds" ], [ "en", "oghalvfems" ], [ "en", "oghalvfjerds" ], [ "fj", "or" ], [ "el", "leve" ], [ "sy", "tten" ], [ "fjor", "ten" ], [ "n", "u" ], [ "nu", "l" ] ] } }