| { | |
| "version": "1.0", | |
| "truncation": null, | |
| "padding": null, | |
| "added_tokens": [ | |
| { | |
| "id": 0, | |
| "content": "[UNK]", | |
| "single_word": false, | |
| "lstrip": false, | |
| "rstrip": false, | |
| "normalized": false, | |
| "special": true | |
| } | |
| ], | |
| "normalizer": null, | |
| "pre_tokenizer": { | |
| "type": "Whitespace" | |
| }, | |
| "post_processor": null, | |
| "decoder": null, | |
| "model": { | |
| "type": "BPE", | |
| "dropout": null, | |
| "unk_token": null, | |
| "continuing_subword_prefix": null, | |
| "end_of_word_suffix": null, | |
| "fuse_unk": false, | |
| "byte_fallback": false, | |
| "ignore_merges": false, | |
| "vocab": { | |
| "[UNK]": 0, | |
| "\"": 1, | |
| "'": 2, | |
| "(": 3, | |
| ")": 4, | |
| ",": 5, | |
| "-": 6, | |
| ".": 7, | |
| "/": 8, | |
| "0": 9, | |
| "1": 10, | |
| "2": 11, | |
| "3": 12, | |
| "4": 13, | |
| "5": 14, | |
| "6": 15, | |
| "7": 16, | |
| "8": 17, | |
| "9": 18, | |
| ":": 19, | |
| ";": 20, | |
| "A": 21, | |
| "B": 22, | |
| "C": 23, | |
| "D": 24, | |
| "E": 25, | |
| "F": 26, | |
| "G": 27, | |
| "H": 28, | |
| "I": 29, | |
| "J": 30, | |
| "K": 31, | |
| "L": 32, | |
| "M": 33, | |
| "N": 34, | |
| "O": 35, | |
| "P": 36, | |
| "Q": 37, | |
| "R": 38, | |
| "S": 39, | |
| "T": 40, | |
| "U": 41, | |
| "V": 42, | |
| "X": 43, | |
| "Y": 44, | |
| "Z": 45, | |
| "[": 46, | |
| "]": 47, | |
| "a": 48, | |
| "b": 49, | |
| "c": 50, | |
| "d": 51, | |
| "e": 52, | |
| "f": 53, | |
| "g": 54, | |
| "h": 55, | |
| "i": 56, | |
| "j": 57, | |
| "k": 58, | |
| "l": 59, | |
| "m": 60, | |
| "n": 61, | |
| "o": 62, | |
| "p": 63, | |
| "q": 64, | |
| "r": 65, | |
| "s": 66, | |
| "t": 67, | |
| "u": 68, | |
| "v": 69, | |
| "w": 70, | |
| "x": 71, | |
| "y": 72, | |
| "z": 73, | |
| "Ç": 74, | |
| "Î": 75, | |
| "â": 76, | |
| "ç": 77, | |
| "ê": 78, | |
| "ë": 79, | |
| "î": 80, | |
| "ö": 81, | |
| "û": 82, | |
| "ü": 83, | |
| "ı": 84, | |
| "Ş": 85, | |
| "ş": 86, | |
| "‘": 87, | |
| "’": 88, | |
| "…": 89, | |
| "an": 90, | |
| "er": 91, | |
| "ku": 92, | |
| "in": 93, | |
| "ên": 94, | |
| "rd": 95, | |
| "man": 96, | |
| "ar": 97, | |
| "ir": 98, | |
| "ek": 99, | |
| "li": 100, | |
| "bi": 101, | |
| "iy": 102, | |
| "kurd": 103, | |
| "de": 104, | |
| "iman": 105, | |
| "în": 106, | |
| "di": 107, | |
| "ziman": 108, | |
| "av": 109, | |
| "st": 110, | |
| "we": 111, | |
| "he": 112, | |
| "ay": 113, | |
| "at": 114, | |
| "ji": 115, | |
| "jî": 116, | |
| "xwe": 117, | |
| "el": 118, | |
| "kurdî": 119, | |
| "tê": 120, | |
| "ne": 121, | |
| "Ku": 122, | |
| "or": 123, | |
| "ist": 124, | |
| "ye": 125, | |
| "zimanê": 126, | |
| "ey": 127, | |
| "ber": 128, | |
| "ro": 129, | |
| "ser": 130, | |
| "tin": 131, | |
| "kir": 132, | |
| "gel": 133, | |
| "Kurd": 134, | |
| "lê": 135, | |
| "pê": 136, | |
| "istan": 137, | |
| "kî": 138, | |
| "bû": 139, | |
| "manc": 140, | |
| "iya": 141, | |
| "en": 142, | |
| "ekî": 143, | |
| "ax": 144, | |
| "na": 145, | |
| "ba": 146, | |
| "din": 147, | |
| "arav": 148, | |
| "ra": 149, | |
| "hat": 150, | |
| "ko": 151, | |
| "kur": 152, | |
| "sa": 153, | |
| "vî": 154, | |
| "zarav": 155, | |
| "anî": 156, | |
| "kirin": 157, | |
| "dî": 158, | |
| "nav": 159, | |
| "ya": 160, | |
| "ih": 161, | |
| "Kurdistan": 162, | |
| "ew": 163, | |
| "her": 164, | |
| "mî": 165, | |
| "iye": 166, | |
| "ma": 167, | |
| "tî": 168, | |
| "zaravay": 169, | |
| "da": 170, | |
| "eb": 171, | |
| "ni": 172, | |
| "Ji": 173, | |
| "ftin": 174, | |
| "me": 175, | |
| "mancî": 176, | |
| "axa": 177, | |
| "Kurdistanê": 178, | |
| "em": 179, | |
| "is": 180, | |
| "be": 181, | |
| "lat": 182, | |
| "ve": 183, | |
| "axaftin": 184, | |
| "iş": 185, | |
| "kar": 186, | |
| "yê": 187, | |
| "irk": 188, | |
| "Li": 189, | |
| "andin": 190, | |
| "bo": 191, | |
| "ev": 192, | |
| "wek": 193, | |
| "yên": 194, | |
| "anîn": 195, | |
| "re": 196, | |
| "roj": 197, | |
| "vîs": 198, | |
| "nivîs": 199, | |
| "al": 200, | |
| "van": 201, | |
| "yek": 202, | |
| "arê": 203, | |
| "hem": 204, | |
| "oranî": 205, | |
| "du": 206, | |
| "nî": 207, | |
| "wan": 208, | |
| "êr": 209, | |
| "ûr": 210, | |
| "kurdan": 211, | |
| "et": 212, | |
| "hin": 213, | |
| "vê": 214, | |
| "eyên": 215, | |
| "gelek": 216, | |
| "pêş": 217, | |
| "nas": 218, | |
| "hatiye": 219, | |
| "saz": 220, | |
| "ebî": 221, | |
| "ali": 222, | |
| "hi": 223, | |
| "lîn": 224, | |
| "ok": 225, | |
| "ine": 226, | |
| "iyê": 227, | |
| "dev": 228, | |
| "dik": 229, | |
| "ayê": 230, | |
| "lêko": 231, | |
| "bûna": 232, | |
| "bakur": 233, | |
| "kurmancî": 234, | |
| "iha": 235, | |
| "lêkolîn": 236, | |
| "aw": 237, | |
| "eh": 238, | |
| "far": 239, | |
| "go": 240, | |
| "lî": 241, | |
| "mi": 242, | |
| "wê": 243, | |
| "zê": 244, | |
| "îr": 245, | |
| "erebî": 246, | |
| "iyên": 247, | |
| "îna": 248, | |
| "Kur": 249, | |
| "aliyê": 250, | |
| "hilat": 251, | |
| "faris": 252, | |
| "Tirk": 253, | |
| "as": 254, | |
| "az": 255 | |
| }, | |
| "merges": [ | |
| [ | |
| "a", | |
| "n" | |
| ], | |
| [ | |
| "e", | |
| "r" | |
| ], | |
| [ | |
| "k", | |
| "u" | |
| ], | |
| [ | |
| "i", | |
| "n" | |
| ], | |
| [ | |
| "ê", | |
| "n" | |
| ], | |
| [ | |
| "r", | |
| "d" | |
| ], | |
| [ | |
| "m", | |
| "an" | |
| ], | |
| [ | |
| "a", | |
| "r" | |
| ], | |
| [ | |
| "i", | |
| "r" | |
| ], | |
| [ | |
| "e", | |
| "k" | |
| ], | |
| [ | |
| "l", | |
| "i" | |
| ], | |
| [ | |
| "b", | |
| "i" | |
| ], | |
| [ | |
| "i", | |
| "y" | |
| ], | |
| [ | |
| "ku", | |
| "rd" | |
| ], | |
| [ | |
| "d", | |
| "e" | |
| ], | |
| [ | |
| "i", | |
| "man" | |
| ], | |
| [ | |
| "î", | |
| "n" | |
| ], | |
| [ | |
| "d", | |
| "i" | |
| ], | |
| [ | |
| "z", | |
| "iman" | |
| ], | |
| [ | |
| "a", | |
| "v" | |
| ], | |
| [ | |
| "s", | |
| "t" | |
| ], | |
| [ | |
| "w", | |
| "e" | |
| ], | |
| [ | |
| "h", | |
| "e" | |
| ], | |
| [ | |
| "a", | |
| "y" | |
| ], | |
| [ | |
| "a", | |
| "t" | |
| ], | |
| [ | |
| "j", | |
| "i" | |
| ], | |
| [ | |
| "j", | |
| "î" | |
| ], | |
| [ | |
| "x", | |
| "we" | |
| ], | |
| [ | |
| "e", | |
| "l" | |
| ], | |
| [ | |
| "kurd", | |
| "î" | |
| ], | |
| [ | |
| "t", | |
| "ê" | |
| ], | |
| [ | |
| "n", | |
| "e" | |
| ], | |
| [ | |
| "K", | |
| "u" | |
| ], | |
| [ | |
| "o", | |
| "r" | |
| ], | |
| [ | |
| "i", | |
| "st" | |
| ], | |
| [ | |
| "y", | |
| "e" | |
| ], | |
| [ | |
| "ziman", | |
| "ê" | |
| ], | |
| [ | |
| "e", | |
| "y" | |
| ], | |
| [ | |
| "b", | |
| "er" | |
| ], | |
| [ | |
| "r", | |
| "o" | |
| ], | |
| [ | |
| "s", | |
| "er" | |
| ], | |
| [ | |
| "t", | |
| "in" | |
| ], | |
| [ | |
| "k", | |
| "ir" | |
| ], | |
| [ | |
| "g", | |
| "el" | |
| ], | |
| [ | |
| "Ku", | |
| "rd" | |
| ], | |
| [ | |
| "l", | |
| "ê" | |
| ], | |
| [ | |
| "p", | |
| "ê" | |
| ], | |
| [ | |
| "ist", | |
| "an" | |
| ], | |
| [ | |
| "k", | |
| "î" | |
| ], | |
| [ | |
| "b", | |
| "û" | |
| ], | |
| [ | |
| "man", | |
| "c" | |
| ], | |
| [ | |
| "iy", | |
| "a" | |
| ], | |
| [ | |
| "e", | |
| "n" | |
| ], | |
| [ | |
| "ek", | |
| "î" | |
| ], | |
| [ | |
| "a", | |
| "x" | |
| ], | |
| [ | |
| "n", | |
| "a" | |
| ], | |
| [ | |
| "b", | |
| "a" | |
| ], | |
| [ | |
| "d", | |
| "in" | |
| ], | |
| [ | |
| "ar", | |
| "av" | |
| ], | |
| [ | |
| "r", | |
| "a" | |
| ], | |
| [ | |
| "h", | |
| "at" | |
| ], | |
| [ | |
| "k", | |
| "o" | |
| ], | |
| [ | |
| "ku", | |
| "r" | |
| ], | |
| [ | |
| "s", | |
| "a" | |
| ], | |
| [ | |
| "v", | |
| "î" | |
| ], | |
| [ | |
| "z", | |
| "arav" | |
| ], | |
| [ | |
| "an", | |
| "î" | |
| ], | |
| [ | |
| "kir", | |
| "in" | |
| ], | |
| [ | |
| "d", | |
| "î" | |
| ], | |
| [ | |
| "n", | |
| "av" | |
| ], | |
| [ | |
| "y", | |
| "a" | |
| ], | |
| [ | |
| "i", | |
| "h" | |
| ], | |
| [ | |
| "Kurd", | |
| "istan" | |
| ], | |
| [ | |
| "e", | |
| "w" | |
| ], | |
| [ | |
| "h", | |
| "er" | |
| ], | |
| [ | |
| "m", | |
| "î" | |
| ], | |
| [ | |
| "iy", | |
| "e" | |
| ], | |
| [ | |
| "m", | |
| "a" | |
| ], | |
| [ | |
| "t", | |
| "î" | |
| ], | |
| [ | |
| "zarav", | |
| "ay" | |
| ], | |
| [ | |
| "d", | |
| "a" | |
| ], | |
| [ | |
| "e", | |
| "b" | |
| ], | |
| [ | |
| "n", | |
| "i" | |
| ], | |
| [ | |
| "J", | |
| "i" | |
| ], | |
| [ | |
| "f", | |
| "tin" | |
| ], | |
| [ | |
| "m", | |
| "e" | |
| ], | |
| [ | |
| "manc", | |
| "î" | |
| ], | |
| [ | |
| "ax", | |
| "a" | |
| ], | |
| [ | |
| "Kurdistan", | |
| "ê" | |
| ], | |
| [ | |
| "e", | |
| "m" | |
| ], | |
| [ | |
| "i", | |
| "s" | |
| ], | |
| [ | |
| "b", | |
| "e" | |
| ], | |
| [ | |
| "l", | |
| "at" | |
| ], | |
| [ | |
| "v", | |
| "e" | |
| ], | |
| [ | |
| "axa", | |
| "ftin" | |
| ], | |
| [ | |
| "i", | |
| "ş" | |
| ], | |
| [ | |
| "k", | |
| "ar" | |
| ], | |
| [ | |
| "y", | |
| "ê" | |
| ], | |
| [ | |
| "ir", | |
| "k" | |
| ], | |
| [ | |
| "L", | |
| "i" | |
| ], | |
| [ | |
| "an", | |
| "din" | |
| ], | |
| [ | |
| "b", | |
| "o" | |
| ], | |
| [ | |
| "e", | |
| "v" | |
| ], | |
| [ | |
| "w", | |
| "ek" | |
| ], | |
| [ | |
| "y", | |
| "ên" | |
| ], | |
| [ | |
| "an", | |
| "în" | |
| ], | |
| [ | |
| "r", | |
| "e" | |
| ], | |
| [ | |
| "ro", | |
| "j" | |
| ], | |
| [ | |
| "vî", | |
| "s" | |
| ], | |
| [ | |
| "ni", | |
| "vîs" | |
| ], | |
| [ | |
| "a", | |
| "l" | |
| ], | |
| [ | |
| "v", | |
| "an" | |
| ], | |
| [ | |
| "y", | |
| "ek" | |
| ], | |
| [ | |
| "ar", | |
| "ê" | |
| ], | |
| [ | |
| "he", | |
| "m" | |
| ], | |
| [ | |
| "or", | |
| "anî" | |
| ], | |
| [ | |
| "d", | |
| "u" | |
| ], | |
| [ | |
| "n", | |
| "î" | |
| ], | |
| [ | |
| "w", | |
| "an" | |
| ], | |
| [ | |
| "ê", | |
| "r" | |
| ], | |
| [ | |
| "û", | |
| "r" | |
| ], | |
| [ | |
| "kurd", | |
| "an" | |
| ], | |
| [ | |
| "e", | |
| "t" | |
| ], | |
| [ | |
| "h", | |
| "in" | |
| ], | |
| [ | |
| "v", | |
| "ê" | |
| ], | |
| [ | |
| "ey", | |
| "ên" | |
| ], | |
| [ | |
| "gel", | |
| "ek" | |
| ], | |
| [ | |
| "pê", | |
| "ş" | |
| ], | |
| [ | |
| "na", | |
| "s" | |
| ], | |
| [ | |
| "hat", | |
| "iye" | |
| ], | |
| [ | |
| "sa", | |
| "z" | |
| ], | |
| [ | |
| "eb", | |
| "î" | |
| ], | |
| [ | |
| "a", | |
| "li" | |
| ], | |
| [ | |
| "h", | |
| "i" | |
| ], | |
| [ | |
| "l", | |
| "în" | |
| ], | |
| [ | |
| "o", | |
| "k" | |
| ], | |
| [ | |
| "in", | |
| "e" | |
| ], | |
| [ | |
| "iy", | |
| "ê" | |
| ], | |
| [ | |
| "de", | |
| "v" | |
| ], | |
| [ | |
| "di", | |
| "k" | |
| ], | |
| [ | |
| "ay", | |
| "ê" | |
| ], | |
| [ | |
| "lê", | |
| "ko" | |
| ], | |
| [ | |
| "bû", | |
| "na" | |
| ], | |
| [ | |
| "ba", | |
| "kur" | |
| ], | |
| [ | |
| "kur", | |
| "mancî" | |
| ], | |
| [ | |
| "ih", | |
| "a" | |
| ], | |
| [ | |
| "lêko", | |
| "lîn" | |
| ], | |
| [ | |
| "a", | |
| "w" | |
| ], | |
| [ | |
| "e", | |
| "h" | |
| ], | |
| [ | |
| "f", | |
| "ar" | |
| ], | |
| [ | |
| "g", | |
| "o" | |
| ], | |
| [ | |
| "l", | |
| "î" | |
| ], | |
| [ | |
| "m", | |
| "i" | |
| ], | |
| [ | |
| "w", | |
| "ê" | |
| ], | |
| [ | |
| "z", | |
| "ê" | |
| ], | |
| [ | |
| "î", | |
| "r" | |
| ], | |
| [ | |
| "er", | |
| "ebî" | |
| ], | |
| [ | |
| "iy", | |
| "ên" | |
| ], | |
| [ | |
| "în", | |
| "a" | |
| ], | |
| [ | |
| "Ku", | |
| "r" | |
| ], | |
| [ | |
| "ali", | |
| "yê" | |
| ], | |
| [ | |
| "hi", | |
| "lat" | |
| ], | |
| [ | |
| "far", | |
| "is" | |
| ], | |
| [ | |
| "T", | |
| "irk" | |
| ], | |
| [ | |
| "a", | |
| "s" | |
| ], | |
| [ | |
| "a", | |
| "z" | |
| ] | |
| ] | |
| } | |
| } |