{ "version": "1.0", "truncation": null, "padding": null, "added_tokens": [ { "id": 0, "special": true, "content": "[STOP]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false }, { "id": 1, "special": true, "content": "[UNK]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false }, { "id": 2, "special": true, "content": "[SPACE]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false }, { "id": 255, "special": true, "content": "[START]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false }, { "id": 604, "content": "[UH]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 605, "content": "[UM]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 606, "content": "[giggle]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 607, "content": "[laughter]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 608, "content": "[guffaw]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 609, "content": "[inhale]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 610, "content": "[exhale]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 611, "content": "[sigh]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 612, "content": "[cry]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 613, "content": "[bark]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 614, "content": "[howl]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 615, "content": "[meow]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 616, "content": "[singing]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 617, "content": "[music]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 618, "content": "[whistle]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 619, "content": "[humming]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 620, "content": "[gasp]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 621, "content": "[groan]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 622, "content": "[whisper]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 623, "content": "[mumble]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 624, "content": "[sniff]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 625, "content": "[sneeze]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 626, "content": "[cough]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 627, "content": "[snore]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 628, "content": "[chew]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 629, "content": "[sip]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 630, "content": "[clear_throat]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 631, "content": "[kiss]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 632, "content": "[shhh]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 633, "content": "[gibberish]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 634, "content": "[fr]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 635, "content": "[es]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 636, "content": "[de]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 637, "content": "[it]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 638, "content": "[ipa]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 639, "content": "[end_of_label]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 695, "content": "[PLACEHOLDER55]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 696, "content": "[PLACEHOLDER56]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 697, "content": "[PLACEHOLDER57]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 698, "content": "[PLACEHOLDER58]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 699, "content": "[PLACEHOLDER59]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 700, "content": "[PLACEHOLDER60]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 701, "content": "[PLACEHOLDER61]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 702, "content": "[PLACEHOLDER62]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 703, "content": "[PLACEHOLDER63]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 704, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 705, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 706, "content": "", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true }, { "id": 707, "content": "[xh]", "single_word": false, "lstrip": false, "rstrip": false, "normalized": false, "special": true } ], "normalizer": null, "pre_tokenizer": { "type": "Whitespace" }, "post_processor": null, "decoder": null, "model": { "type": "BPE", "dropout": null, "unk_token": "[UNK]", "continuing_subword_prefix": null, "end_of_word_suffix": null, "fuse_unk": false, "vocab": { "[STOP]": 0, "[UNK]": 1, "[SPACE]": 2, "!": 3, "'": 4, "(": 5, ")": 6, ",": 7, "-": 8, ".": 9, "/": 10, ":": 11, ";": 12, "?": 13, "a": 14, "b": 15, "c": 16, "d": 17, "e": 18, "f": 19, "g": 20, "h": 21, "i": 22, "j": 23, "k": 24, "l": 25, "m": 26, "n": 27, "o": 28, "p": 29, "q": 30, "r": 31, "s": 32, "t": 33, "u": 34, "v": 35, "w": 36, "x": 37, "y": 38, "z": 39, "th": 40, "in": 41, "the": 42, "an": 43, "er": 44, "ou": 45, "re": 46, "on": 47, "at": 48, "ed": 49, "en": 50, "to": 51, "ing": 52, "and": 53, "is": 54, "as": 55, "al": 56, "or": 57, "of": 58, "ar": 59, "it": 60, "es": 61, "he": 62, "st": 63, "le": 64, "om": 65, "se": 66, "be": 67, "ad": 68, "ow": 69, "ly": 70, "ch": 71, "wh": 72, "that": 73, "you": 74, "li": 75, "ve": 76, "ac": 77, "ti": 78, "ld": 79, "me": 80, "was": 81, "gh": 82, "id": 83, "ll": 84, "wi": 85, "ent": 86, "for": 87, "ay": 88, "ro": 89, "ver": 90, "ic": 91, "her": 92, "ke": 93, "his": 94, "no": 95, "ut": 96, "un": 97, "ir": 98, "lo": 99, "we": 100, "ri": 101, "ha": 102, "with": 103, "ght": 104, "out": 105, "im": 106, "ion": 107, "all": 108, "ab": 109, "one": 110, "ne": 111, "ge": 112, "ould": 113, "ter": 114, "mo": 115, "had": 116, "ce": 117, "she": 118, "go": 119, "sh": 120, "ur": 121, "am": 122, "so": 123, "pe": 124, "my": 125, "de": 126, "are": 127, "but": 128, "ome": 129, "fr": 130, "ther": 131, "fe": 132, "su": 133, "do": 134, "con": 135, "te": 136, "ain": 137, "ere": 138, "po": 139, "if": 140, "they": 141, "us": 142, "ag": 143, "tr": 144, "now": 145, "oun": 146, "this": 147, "have": 148, "not": 149, "sa": 150, "il": 151, "up": 152, "thing": 153, "from": 154, "ap": 155, "him": 156, "ack": 157, "ation": 158, "ant": 159, "our": 160, "op": 161, "like": 162, "ust": 163, "ess": 164, "bo": 165, "ok": 166, "ul": 167, "ind": 168, "ex": 169, "com": 170, "some": 171, "there": 172, "ers": 173, "co": 174, "res": 175, "man": 176, "ard": 177, "pl": 178, "wor": 179, "way": 180, "tion": 181, "fo": 182, "ca": 183, "were": 184, "by": 185, "ate": 186, "pro": 187, "ted": 188, "ound": 189, "own": 190, "would": 191, "ts": 192, "what": 193, "qu": 194, "ally": 195, "ight": 196, "ck": 197, "gr": 198, "when": 199, "ven": 200, "can": 201, "ough": 202, "ine": 203, "end": 204, "per": 205, "ous": 206, "od": 207, "ide": 208, "know": 209, "ty": 210, "very": 211, "si": 212, "ak": 213, "who": 214, "about": 215, "ill": 216, "them": 217, "est": 218, "red": 219, "ye": 220, "could": 221, "ong": 222, "your": 223, "their": 224, "em": 225, "just": 226, "other": 227, "into": 228, "any": 229, "whi": 230, "um": 231, "tw": 232, "ast": 233, "der": 234, "did": 235, "ie": 236, "been": 237, "ace": 238, "ink": 239, "ity": 240, "back": 241, "ting": 242, "br": 243, "more": 244, "ake": 245, "pp": 246, "then": 247, "sp": 248, "el": 249, "use": 250, "bl": 251, "said": 252, "over": 253, "get": 254, "[START]": 255, "\"": 256, "#": 257, "$": 258, "%": 259, "&": 260, "*": 261, "+": 262, "0": 263, "1": 264, "2": 265, "3": 266, "4": 267, "5": 268, "6": 269, "7": 270, "8": 271, "9": 272, "<": 273, "=": 274, ">": 275, "@": 276, "A": 277, "B": 278, "C": 279, "D": 280, "E": 281, "F": 282, "G": 283, "H": 284, "I": 285, "J": 286, "K": 287, "L": 288, "M": 289, "N": 290, "O": 291, "P": 292, "Q": 293, "R": 294, "S": 295, "T": 296, "U": 297, "V": 298, "W": 299, "X": 300, "Y": 301, "Z": 302, "[": 303, "\\": 304, "]": 305, "^": 306, "_": 307, "`": 308, "{": 309, "|": 310, "}": 311, "~": 312, "‐": 313, "‑": 314, "‒": 315, "–": 316, "—": 317, "―": 318, "‖": 319, "‗": 320, "‘": 321, "’": 322, "‚": 323, "‛": 324, "“": 325, "”": 326, "„": 327, "‟": 328, " ": 329, "¡": 330, "¢": 331, "£": 332, "¤": 333, "¥": 334, "¦": 335, "§": 336, "¨": 337, "©": 338, "ª": 339, "«": 340, "¬": 341, "­": 342, "®": 343, "¯": 344, "°": 345, "±": 346, "²": 347, "³": 348, "´": 349, "µ": 350, "¶": 351, "·": 352, "¸": 353, "¹": 354, "º": 355, "»": 356, "¼": 357, "½": 358, "¾": 359, "¿": 360, "À": 361, "Á": 362, "Â": 363, "Ã": 364, "Ä": 365, "Å": 366, "Æ": 367, "Ç": 368, "È": 369, "É": 370, "Ê": 371, "Ë": 372, "Ì": 373, "Í": 374, "Î": 375, "Ï": 376, "Ð": 377, "Ñ": 378, "Ò": 379, "Ó": 380, "Ô": 381, "Õ": 382, "Ö": 383, "×": 384, "Ø": 385, "Ù": 386, "Ú": 387, "Û": 388, "Ü": 389, "Ý": 390, "Þ": 391, "ß": 392, "à": 393, "á": 394, "â": 395, "ã": 396, "ä": 397, "å": 398, "æ": 399, "ç": 400, "è": 401, "é": 402, "ê": 403, "ë": 404, "ì": 405, "í": 406, "î": 407, "ï": 408, "ð": 409, "ñ": 410, "ò": 411, "ó": 412, "ô": 413, "õ": 414, "ö": 415, "÷": 416, "ø": 417, "ù": 418, "ú": 419, "û": 420, "ü": 421, "ý": 422, "þ": 423, "ÿ": 424, "ɐ": 425, "ɑ": 426, "ɒ": 427, "ɓ": 428, "ɔ": 429, "ɕ": 430, "ɖ": 431, "ɗ": 432, "ɘ": 433, "ə": 434, "ɚ": 435, "ɛ": 436, "ɜ": 437, "ɝ": 438, "ɞ": 439, "ɟ": 440, "ɠ": 441, "ɡ": 442, "ɢ": 443, "ɣ": 444, "ɤ": 445, "ɥ": 446, "ɦ": 447, "ɧ": 448, "ɨ": 449, "ɩ": 450, "ɪ": 451, "ɫ": 452, "ɬ": 453, "ɭ": 454, "ɮ": 455, "ɯ": 456, "ɰ": 457, "ɱ": 458, "ɲ": 459, "ɳ": 460, "ɴ": 461, "ɵ": 462, "ɶ": 463, "ɷ": 464, "ɸ": 465, "ɹ": 466, "ɺ": 467, "ɻ": 468, "ɼ": 469, "ɽ": 470, "ɾ": 471, "ɿ": 472, "ʀ": 473, "ʁ": 474, "ʂ": 475, "ʃ": 476, "ʄ": 477, "ʅ": 478, "ʆ": 479, "ʇ": 480, "ʈ": 481, "ʉ": 482, "ʊ": 483, "ʋ": 484, "ʌ": 485, "ʍ": 486, "ʎ": 487, "ʏ": 488, "ʐ": 489, "ʑ": 490, "ʒ": 491, "ʓ": 492, "ʔ": 493, "ʕ": 494, "ʖ": 495, "ʗ": 496, "ʘ": 497, "ʙ": 498, "ʚ": 499, "ʛ": 500, "ʜ": 501, "ʝ": 502, "ʞ": 503, "ʟ": 504, "ʠ": 505, "ʡ": 506, "ʢ": 507, "ʣ": 508, "ʤ": 509, "ʥ": 510, "ʦ": 511, "ʧ": 512, "ʨ": 513, "ʩ": 514, "ʪ": 515, "ʫ": 516, "ʬ": 517, "ʭ": 518, "ʮ": 519, "ʯ": 520, "ʰ": 521, "ʱ": 522, "ʲ": 523, "ʳ": 524, "ʴ": 525, "ʵ": 526, "ʶ": 527, "ʷ": 528, "ʸ": 529, "ʹ": 530, "ʺ": 531, "ʻ": 532, "ʼ": 533, "ʽ": 534, "ʾ": 535, "ʿ": 536, "ˀ": 537, "ˁ": 538, "˂": 539, "˃": 540, "˄": 541, "˅": 542, "ˆ": 543, "ˇ": 544, "ˈ": 545, "ˉ": 546, "ˊ": 547, "ˋ": 548, "ˌ": 549, "ˍ": 550, "ˎ": 551, "ˏ": 552, "ː": 553, "ˑ": 554, "˒": 555, "˓": 556, "˔": 557, "˕": 558, "˖": 559, "˗": 560, "˘": 561, "˙": 562, "˚": 563, "˛": 564, "˜": 565, "˝": 566, "˞": 567, "˟": 568, "ˠ": 569, "ˡ": 570, "ˢ": 571, "ˣ": 572, "ˤ": 573, "˥": 574, "˦": 575, "˧": 576, "˨": 577, "˩": 578, "˪": 579, "˫": 580, "ˬ": 581, "˭": 582, "ˮ": 583, "˯": 584, "˰": 585, "˱": 586, "˲": 587, "˳": 588, "˴": 589, "˵": 590, "˶": 591, "˷": 592, "˸": 593, "˹": 594, "˺": 595, "˻": 596, "˼": 597, "˽": 598, "˾": 599, "˿": 600, "ā": 601, "ō": 602, "…": 603, "[UH]": 604, "[UM]": 605, "[giggle]": 606, "[laughter]": 607, "[guffaw]": 608, "[inhale]": 609, "[exhale]": 610, "[sigh]": 611, "[cry]": 612, "[bark]": 613, "[howl]": 614, "[meow]": 615, "[singing]": 616, "[music]": 617, "[whistle]": 618, "[humming]": 619, "[gasp]": 620, "[groan]": 621, "[whisper]": 622, "[mumble]": 623, "[sniff]": 624, "[sneeze]": 625, "[cough]": 626, "[snore]": 627, "[chew]": 628, "[sip]": 629, "[clear_throat]": 630, "[kiss]": 631, "[shhh]": 632, "[gibberish]": 633, "[fr]": 634, "[es]": 635, "[de]": 636, "[it]": 637, "[ipa]": 638, "[end_of_label]": 639, "ŋ": 640, "ᵻ": 641, "θ": 642, "̩": 643, "̃": 644, "ɑː": 645, "iː": 646, "uː": 647, "ɜː": 648, "ɔː": 649, "oː": 650, "eɪ": 651, "oʊ": 652, "aɪ": 653, "aʊ": 654, "ɔɪ": 655, "dʒ": 656, "tʃ": 657, "ɪŋ": 658, "ᵻd": 659, "ˈiː": 660, "ˌiː": 661, "ˈɪ": 662, "ˌɪ": 663, "ˈeɪ": 664, "ˌeɪ": 665, "ˈɛ": 666, "ˌɛ": 667, "ˈæ": 668, "ˌæ": 669, "ˈɑː": 670, "ˌɑː": 671, "ˈɔː": 672, "ˌɔː": 673, "oːɹ": 674, "ˈoːɹ": 675, "ˌoːɹ": 676, "ˈoʊ": 677, "ˌoʊ": 678, "ˈʊ": 679, "ˌʊ": 680, "ˈuː": 681, "ˌuː": 682, "ˈɜː": 683, "ˌɜː": 684, "ˈʌ": 685, "ˌʌ": 686, "ˈaɪ": 687, "ˌaɪ": 688, "ˈaʊ": 689, "ˌaʊ": 690, "ˈɔɪ": 691, "ˌɔɪ": 692, "ˈɚ": 693, "ˌɐ": 694, "[PLACEHOLDER55]": 695, "[PLACEHOLDER56]": 696, "[PLACEHOLDER57]": 697, "[PLACEHOLDER58]": 698, "[PLACEHOLDER59]": 699, "[PLACEHOLDER60]": 700, "[PLACEHOLDER61]": 701, "[PLACEHOLDER62]": 702, "[PLACEHOLDER63]": 703, "": 704, "": 705, "": 706, "[xh]": 707, "ć": 708, "Ⴀ": 709, "Ⴁ": 710, "Ⴂ": 711, "Ⴃ": 712, "Ⴄ": 713, "Ⴆ": 714, "Ⴈ": 715, "Ⴉ": 716, "Ⴊ": 717, "Ⴋ": 718, "Ⴌ": 719, "Ⴍ": 720, "Ⴎ": 721, "Ⴐ": 722, "Ⴑ": 723, "Ⴒ": 724, "Ⴓ": 725, "Ⴔ": 726, "Ⴕ": 727, "Ⴗ": 728, "Ⴟ": 729, "Ⴠ": 730, "ა": 731, "ბ": 732, "გ": 733, "დ": 734, "ე": 735, "ვ": 736, "ზ": 737, "ი": 738, "კ": 739, "ლ": 740, "მ": 741, "ნ": 742, "ო": 743, "პ": 744, "რ": 745, "ს": 746, "ტ": 747, "უ": 748, "ფ": 749, "ქ": 750, "ყ": 751, "ც": 752, "წ": 753, "ხ": 754, "ჯ": 755, "ჰ": 756, "": 757, "კუ": 758, "ან": 759, "ელ": 760, "ენ": 761, "ზი": 762, "წა": 763, "ბა": 764, "ნგ": 765, "ტჰ": 766, "სი": 767, "ლა": 768, "ინ": 769, "მა": 770, "პჰ": 771, "ის": 772, "კჰ": 773, "კა": 774, "ლო": 775, "ყო": 776, "წე": 777, "ლუ": 778, "ყა": 779, "ლე": 780, "კო": 781, "უკუ": 782, "ონ": 783, "ყე": 784, "ოკუ": 785, "ზა": 786, "ელა": 787, "უმ": 788, "ლი": 789, "სჰ": 790, "ანგ": 791, "ნგა": 792, "სე": 793, "ნა": 794, "ეზი": 795, "კწა": 796, "ელე": 797, "კწ": 798, "ანა": 799, "და": 800, "ბუ": 801, "ბე": 802, "ტჰი": 803, "უნ": 804, "ყი": 805, "კე": 806, "დი": 807, "სა": 808, "ბან": 809, "ენი": 810, "ბო": 811, "ჰა": 812, "ემ": 813, "პჰა": 814, "ნტ": 815, "ომ": 816, "ტჰა": 817, "ელო": 818, "ისა": 819, "ენგ": 820, "ზე": 821, "ამა": 822, "კჰო": 823, "ზო": 824, "ტსჰ": 825, "ჰლა": 826, "იმ": 827, "ანგა": 828, "ესი": 829, "კწე": 830, "ტჰე": 831, "ულუ": 832, "ბი": 833, "ინი": 834, "ელი": 835, "უკუბა": 836, "აბა": 837, "ენზი": 838, "ანდ": 839, "კი": 840, "ისე": 841, "დო": 842, "ლწა": 843, "ფუნ": 844, "იზი": 845, "ნე": 846, "ბონ": 847, "ისი": 848, "ტჰუ": 849, "ინტ": 850, "ხა": 851, "წუ": 852, "ისო": 853, "წო": 854, "კუბა": 855, "ლეყო": 856, "ენტ": 857, "ნგო": 858, "ანე": 859, "ნოკუ": 860, "ვა": 861, "ჰო": 862, "ნჯ": 863, "ნო": 864, "კან": 865, "ქა": 866, "ბანტ": 867, "კჰე": 868, "ნგოკუ": 869, "კუნ": 870, "მი": 871, "კჰა": 872, "ტყ": 873, "ელწა": 874, "ნგე": 875, "ცე": 876, "ფუ": 877, "კჰუ": 878, "ტჰო": 879, "პჰუ": 880, "პჰე": 881, "ცა": 882, "სებ": 883, "ქუ": 884, "სო": 885, "ჰლ": 886, "ჰუ": 887, "ლელა": 888, "ნტო": 889, "ნი": 890, "მან": 891, "ენე": 892, "ქო": 893, "ესჰ": 894, "ბანტუ": 895, "ანტ": 896, "კჰულუ": 897, "დლა": 898, "ისწა": 899, "ონა": 900, "ოლუ": 901, "ენზა": 902, "ქი": 903, "ჰლო": 904, "ლწ": 905, "კწი": 906, "ფა": 907, "ეკუ": 908, "ლოკუ": 909, "მო": 910, "დე": 911, "ნდი": 912, "პჰო": 913, "ელწე": 914, "ლუნგ": 915, "ვუ": 916, "პჰი": 917, "ტი": 918, "ბჰა": 919, "ფი": 920, "ლწე": 921, "ტყა": 922, "ყოკუ": 923, "ზწე": 924, "სებენზი": 925, "ნტუ": 926, "სუ": 927, "ენა": 928, "ცი": 929, "ნდ": 930, "წანა": 931, "ფუმ": 932, "ელელა": 933, "კუმ": 934, "ანი": 935, "ბჰ": 936, "ენდ": 937, "იმი": 938, "ზოკუ": 939, "ტსჰა": 940, "ანტსი": 941, "კილეყო": 942, "ელელე": 943, "წენი": 944, "ნჯენგ": 945, "ბონა": 946, "გა": 947, "მბა": 948, "ინა": 949, "ონკე": 950, "დწა": 951, "პა": 952, "ესჰა": 953, "წან": 954, "ჯო": 955, "ნგუ": 956, "იინ": 957, "ჰლუ": 958, "ლოო": 959, "მბი": 960, "კანყე": 961, "ხესჰა": 962, "ხო": 963, "ჰლე": 964, "გქი": 965, "ფუნა": 966, "ფუნე": 967, "ხჰო": 968, "ანდა": 969, "ნყე": 970, "ლისა": 971, "ცო": 972, "გუ": 973, "ქჰუ": 974, "რჰ": 975, "აკუ": 976, "ინზი": 977, "ნყ": 978, "ენგა": 979, "ემი": 980, "წეყო": 981, "ინტო": 982, "გც": 983, "ულუმ": 984, "ნამა": 985, "ცჰა": 986, "ენკო": 987, "ინგ": 988, "მპ": 989, "ტა": 990, "ლელე": 991, "კწაზი": 992, "ტჰწა": 993, "კუნყე": 994, "ენზე": 995, "ანდლა": 996, "ნომ": 997, "სელე": 998, "პჰაკა": 999, "აბანტუ": 1000, "ონდო": 1001, "ნეზი": 1002, "კომ": 1003, "ლაწუ": 1004, "ელელ": 1005, "ინდ": 1006, "ზუ": 1007, "ენდა": 1008, "პჰუმ": 1009, "ანგო": 1010, "ასი": 1011, "დოდა": 1012, "ისჰ": 1013, "ენტე": 1014, "უბუ": 1015, "ბინი": 1016, "ფო": 1017, "ოკანყე": 1018, "ელელო": 1019, "სეტყ": 1020, "უყა": 1021, "ზელა": 1022, "ტო": 1023, "სოკუ": 1024, "ნჯე": 1025, "ქინ": 1026, "წანო": 1027, "მალი": 1028, "ფუნეკა": 1029, "ცუ": 1030, "ტსჰო": 1031, "ცჰ": 1032, "ცწა": 1033, "ტჰეტჰა": 1034, "რჰულუმ": 1035, "ნგამა": 1036, "გო": 1037, "კუმა": 1038, "ჰლალა": 1039, "ფან": 1040, "ლენი": 1041, "აყი": 1042, "კქუ": 1043, "კილე": 1044, "ფანა": 1045, "უმა": 1046, "კჰი": 1047, "კუკუ": 1048, "პჰანტსი": 1049, "გამა": 1050, "წაყე": 1051, "ნგენ": 1052, "ყამა": 1053, "კწან": 1054, "ონო": 1055, "მე": 1056, "ონდ": 1057, "ინდა": 1058, "ყაკა": 1059, "ზულუ": 1060, "იკა": 1061, "ლანდ": 1062, "აბან": 1063, "აპჰო": 1064, "დალა": 1065, "ნგუმ": 1066, "ოკო": 1067, "სწა": 1068, "იი": 1069, "ონი": 1070, "პი": 1071, "სისი": 1072, "ინკო": 1073, "კჰონა": 1074, "კწეზი": 1075, "ბანგა": 1076, "პჰამბი": 1077, "კქუბო": 1078, "ლელო": 1079, "აკა": 1080, "ეს": 1081, "კწაყე": 1082, "ალო": 1083, "ბანგ": 1084, "კოდწა": 1085, "ბენზი": 1086, "ანდი": 1087, "იიმ": 1088, "იყა": 1089, "კელე": 1090, "ქესჰ": 1091, "ვუმ": 1092, "რჰულუმენტე": 1093, "სეტყენზი": 1094, "ჰლაბა": 1095, "ნესი": 1096, "ნდა": 1097, "ხი": 1098, "უკუნ": 1099, "ფუმანა": 1100, "ქინისე": 1101, "ობუ": 1102, "ქჰ": 1103, "კუკჰო": 1104, "ელუ": 1105, "ბანტწანა": 1106, "ხჰ": 1107, "ყან": 1108, "კოლო": 1109, "ტჰუბა": 1110, "მბ": 1111, "კალა": 1112, "ქალა": 1113, "ფიკა": 1114, "ამან": 1115, "ფუნდო": 1116, "ნენ": 1117, "ედ": 1118, "ქე": 1119, "ბულა": 1120, "ზწა": 1121, "კწამა": 1122, "ისებენზი": 1123, "ფანელე": 1124, "ლის": 1125, "პჰანდ": 1126, "ეზა": 1127, "უმნტუ": 1128, "პჰუჰლ": 1129, "ნაბა": 1130, "ამ": 1131, "იინტ": 1132, "ქჰა": 1133, "სელა": 1134, "ყინ": 1135, "წოკუ": 1136, "ხჰა": 1137, "ზინ": 1138, "დუ": 1139, "სემ": 1140, "ჯი": 1141, "კელა": 1142, "ლინგ": 1143, "ლულე": 1144, "ზწ": 1145, "ლისე": 1146, "ლოკო": 1147, "ემა": 1148, "ზანტსი": 1149, "კწესი": 1150, "პო": 1151, "ელინ": 1152, "ტჰანდა": 1153, "კწენზა": 1154, "რო": 1155, "პჰაკატჰი": 1156, "პჰელა": 1157, "წანგ": 1158, "ბელე": 1159, "ტჰეტჰო": 1160, "ენდლელა": 1161, "ფუნდი": 1162, "ეყა": 1163, "კწენ": 1164, "ზამა": 1165, "ტყე": 1166, "კულუ": 1167, "კაყო": 1168, "ინგა": 1169, "ლაყო": 1170, "ყესი": 1171, "ჯონგ": 1172, "კისა": 1173, "ტუ": 1174, "წენ": 1175, "კაზი": 1176, "უტჰი": 1177, "ბანდა": 1178, "ნზო": 1179, "სანა": 1180, "უნგა": 1181, "ნოკუბა": 1182, "წანე": 1183, "კაკჰულუ": 1184, "კანტი": 1185, "ცედ": 1186, "ნემ": 1187, "წატჰი": 1188, "ომა": 1189, "ნანგ": 1190, "ნკე": 1191, "უტსჰ": 1192, "ცწანგ": 1193, "ბალა": 1194, "ლომ": 1195, "სებენზა": 1196, "აზი": 1197, "ყაზი": 1198, "კწისი": 1199, "ცწადი": 1200, "იზა": 1201, "კუფუნეკა": 1202, "კუტჰი": 1203, "ბენ": 1204, "წონკე": 1205, "ელანა": 1206, "ბჰუ": 1207, "სომ": 1208, "უნყ": 1209, "ცწანგც": 1210, "უკწა": 1211, "ნგამ": 1212, "კანგა": 1213, "სენ": 1214, "ანყ": 1215, "ეზინ": 1216, "რა": 1217, "ნასე": 1218, "ნჯალო": 1219, "კჰაყა": 1220, "ტჰემ": 1221, "ჰამბა": 1222, "ჰლობო": 1223, "ზელე": 1224, "მბო": 1225, "ბეკა": 1226, "ლუნგუ": 1227, "ხე": 1228, "ყაყი": 1229, "სესი": 1230, "კწიზი": 1231, "ზეზი": 1232, "ლინ": 1233, "ცინ": 1234, "ლანდელა": 1235, "ზანა": 1236, "სჰო": 1237, "ველა": 1238, "აპჰა": 1239, "უყე": 1240, "ყომ": 1241, "კწანოკუ": 1242, "ვო": 1243, "ემვა": 1244, "ებუ": 1245, "კოკუ": 1246, "წამ": 1247, "კულე": 1248, "ბენი": 1249, "რჰა": 1250, "კელო": 1251, "ტჰატჰა": 1252, "ენზიწა": 1253, "ხჰოსა": 1254, "ბჰო": 1255, "ისწე": 1256, "ცალა": 1257, "ლუნგა": 1258, "ლისი": 1259, "კუნგა": 1260, "პჰანდლე": 1261, "ზემ": 1262, "ლწენი": 1263, "პჰამბილი": 1264, "ბელა": 1265, "ზელ": 1266, "ილე": 1267, "უვა": 1268, "სეტყენზისწა": 1269, "ლელ": 1270, "უკუზი": 1271, "სჰი": 1272, "ნგაბა": 1273, "სუკა": 1274, "კელელა": 1275, "ყუ": 1276, "კალოკუ": 1277, "ყამ": 1278, "სჰისჰ": 1279, "ელეყო": 1280, "ცედა": 1281, "წაბა": 1282, "ფუმანე": 1283, "ბუმ": 1284, "კწიმ": 1285, "სუკუ": 1286, "კაკუ": 1287, "ესა": 1288, "ნგომ": 1289, "ნამ": 1290, "ინკოსი": 1291, "ტჰილე": 1292, "ენეყო": 1293, "ლელწა": 1294, "ლულა": 1295, "პჰატჰა": 1296, "ეტჰო": 1297, "უკუზე": 1298, "პჰუმა": 1299, "კისო": 1300, "ფრ": 1301, "ყენ": 1302, "ყისე": 1303, "მანზი": 1304, "ანგე": 1305, "კჰატჰა": 1306, "პილო": 1307, "ჯე": 1308, "კამ": 1309, "ინდაწო": 1310, "ვე": 1311, "ზონკე": 1312, "ფრიკა": 1313, "კწინ": 1314, "ბონკე": 1315, "წალა": 1316, "იზინტო": 1317, "ზომ": 1318, "კარჰულუმენტე": 1319, "ტჰენგ": 1320, "ფუნდა": 1321, "ნტწანა": 1322, "ტჰწე": 1323, "ლანგა": 1324, "ცწანგცისო": 1325, "კანა": 1326, "ზიზი": 1327, "წაზი": 1328, "Ⴌგ": 1329, "სჰე": 1330, "ჰლაწუ": 1331, "ტყალა": 1332, "აბე": 1333, "გი": 1334, "ულო": 1335, "პჰეზულუ": 1336, "რი": 1337, "უბა": 1338, "ჰლწა": 1339, "ფამა": 1340, "ნალო": 1341, "კწაკუ": 1342, "დოლო": 1343, "ლწაზი": 1344, "ზენ": 1345, "წამა": 1346, "ნაკუ": 1347, "ნობუ": 1348, "პჰუჰლისო": 1349, "ზწი": 1350, "ზიკო": 1351, "ოკუბა": 1352, "ენზიწე": 1353, "ბანდლა": 1354, "ბისი": 1355, "ნეე": 1356, "ქონ": 1357, "ცანდ": 1358, "ყაკუ": 1359, "პჰეზუ": 1360, "ტე": 1361, "ნგეზი": 1362, "გუნ": 1363, "ტჰუმ": 1364, "უნი": 1365, "ქონდო": 1366, "ყოკუბა": 1367, "იინკო": 1368, "ცჰაპჰა": 1369, "სჰუ": 1370, "ფუნდ": 1371, "გუქუ": 1372, "აყე": 1373, "ეკო": 1374, "კწაბა": 1375, "ტჰინი": 1376, "ქექესჰ": 1377, "ბაზი": 1378, "ზამ": 1379, "ანგან": 1380, "ყეზი": 1381, "უზა": 1382, "ტჰინტ": 1383, "კჰუსელე": 1384, "ფე": 1385, "ყაკჰე": 1386, "ხჰობო": 1387, "ცოცე": 1388, "ლაკჰე": 1389, "ბანი": 1390, "კწემ": 1391, "ილეყო": 1392, "ხანდ": 1393, "კუყო": 1394, "უმზი": 1395, "ნგოკო": 1396, "ბჰედ": 1397, "ინდლელა": 1398, "სინი": 1399, "ინკ": 1400, "ყონა": 1401, "Ⴀფრიკა": 1402, "ინყაკა": 1403, "საპჰო": 1404, "ენტლა": 1405, "ელელწანო": 1406, "ლანდელაყო": 1407, "კელწა": 1408, "წაყო": 1409, "ბაბე": 1410, "ხაკი": 1411, "ელელეყო": 1412, "ენკონზო": 1413, "კაკუჰლე": 1414, "აწუ": 1415, "ბისო": 1416, "ლინი": 1417, "ნანგა": 1418, "ულა": 1419, "ყის": 1420, "ლონგ": 1421, "ენგე": 1422, "ნემი": 1423, "ენდი": 1424, "წაზა": 1425, "ბესი": 1426, "ლანა": 1427, "ენდაწო": 1428, "აბანგა": 1429, "ზინი": 1430, "კოკო": 1431, "ბანე": 1432, "ტჰეტჰ": 1433, "ქჰუბა": 1434, "ხანდუვა": 1435, "ველ": 1436, "ოყა": 1437, "რჰო": 1438, "კჰაწუ": 1439, "ქელა": 1440, "წელე": 1441, "პჰონდო": 1442, "პჰეპჰა": 1443, "ლაწულო": 1444, "ბალულე": 1445, "ლამ": 1446, "სებე": 1447, "ეზ": 1448, "ლისწა": 1449, "ლან": 1450, "ყატჰ": 1451, "უკუყი": 1452, "სჰა": 1453, "ლესი": 1454, "ქოქო": 1455, "ენზეკა": 1456, "ზინგა": 1457, "ვაკა": 1458, "კელწე": 1459, "წესი": 1460, "უკუტყა": 1461, "ბომი": 1462, "ჰამბ": 1463, "ხიბ": 1464, "ნგესი": 1465, "ისანა": 1466, "სჰისჰინი": 1467, "მანდლა": 1468, "ნონ": 1469, "ენტო": 1470, "ცედისა": 1471, "ლიკა": 1472, "აკუკჰო": 1473, "ქანა": 1474, "ყენა": 1475, "სინგა": 1476, "ყაბა": 1477, "ემპ": 1478, "ბონაკა": 1479, "გოსა": 1480, "ელინყე": 1481, "ბისა": 1482, "ილო": 1483, "ნინზი": 1484, "კუბე": 1485, "ნგაყო": 1486, "კჰალა": 1487, "ფაკა": 1488, "იწა": 1489, "ნგელი": 1490, "ყონკე": 1491, "დლალა": 1492, "ბჰე": 1493, "კჰიწო": 1494, "ცანდელო": 1495, "დუმ": 1496, "ნგენა": 1497, "აბამ": 1498, "დლალო": 1499, "ჯონგენე": 1500, "ზაყო": 1501, "ზიმა": 1502, "ზალი": 1503, "ომბი": 1504, "ლონგწანე": 1505, "გრ": 1506, "ყინტ": 1507, "კუყა": 1508, "სწე": 1509, "ელენი": 1510, "ზაბა": 1511, "ზატჰუ": 1512, "ბომ": 1513, "ქოქოსჰო": 1514, "მელა": 1515, "ქუმ": 1516, "ტჰატჰუ": 1517, "ებე": 1518, "ლისო": 1519, "ყელა": 1520, "ესიტჰი": 1521, "ფაზი": 1522, "ბონაკალა": 1523, "ცოცეკო": 1524, "Ⴉუ": 1525, "Ⴋზანტსი": 1526, "Ⴑი": 1527, "ასე": 1528, "ელელწა": 1529, "ენყე": 1530, "კჰუპჰა": 1531, "ლაწულა": 1532, "ცელო": 1533, "კწენი": 1534, "სებენზისა": 1535, "ბანდაკან": 1536, "ელწანო": 1537, "ზიმ": 1538, "ტჰელა": 1539, "ეზინყე": 1540, "ქუკა": 1541, "კჰიწა": 1542, "Ⴋა": 1543, "ჯწა": 1544, "კჰანგ": 1545, "წეტჰუ": 1546, "ამადოდა": 1547, "ლუნგისა": 1548, "ნდლუ": 1549, "ლინდ": 1550, "ტსა": 1551, "უსი": 1552, "მალუნგა": 1553, "დიბან": 1554, "ბანა": 1555, "ლილო": 1556, "00": 1557, "განგა": 1558, "კცუ": 1559, "სეკუ": 1560, "კჰუტჰა": 1561, "ცაც": 1562, "ლწინი": 1563, "ება": 1564, "ყოლუ": 1565, "კწამ": 1566, "ტსჰანე": 1567, "ცებო": 1568, "ლალა": 1569, "ლეკო": 1570, "კწაკჰე": 1571, "ვან": 1572, "ილი": 1573, "მნ": 1574, "ყანგა": 1575, "ისელო": 1576, "კჰუმ": 1577, "პჰატჰ": 1578, "კწეტჰუ": 1579, "გცინ": 1580, "ბაყა": 1581, "ტჰანდ": 1582, "კჰან": 1583, "ყიმ": 1584, "ცჰი": 1585, "ზელწა": 1586, "ნგელა": 1587, "ნოკო": 1588, "ზესი": 1589, "ელწეყო": 1590, "იბე": 1591, "რე": 1592, "უსა": 1593, "ყენი": 1594, "მასი": 1595, "გცინა": 1596, "აბანტწანა": 1597, "მნტუ": 1598, "სელწა": 1599, "ჯელო": 1600, "ყილე": 1601, "კჰოსი": 1602, "ეზო": 1603, "კულო": 1604, "კუპჰელა": 1605, "ყემ": 1606, "პჰალო": 1607, "ტსჰი": 1608, "კანი": 1609, "პაწუ": 1610, "პჰუმო": 1611, "უტჰიხო": 1612, "უკუმ": 1613, "უმნ": 1614, "ბუყა": 1615, "ნგეკჰო": 1616, "ელუნგ": 1617, "ფანელეკილეყო": 1618, "ზელწე": 1619, "იხესჰა": 1620, "წაბო": 1621, "ბამ": 1622, "სჰუმ": 1623, "ეზინგა": 1624, "გაქო": 1625, "ნგამელი": 1626, "იინგ": 1627, "კრ": 1628, "ბალი": 1629, "სეკო": 1630, "ნგენხა": 1631, "სონ": 1632, "ტყი": 1633, "ბასე": 1634, "ვუმა": 1635, "ხიბელელწანო": 1636, "ზიბე": 1637, "სინ": 1638, "კწემი": 1639, "კუმბი": 1640, "ბანგელა": 1641, "უბე": 1642, "კუდალა": 1643, "ლეკა": 1644, "ჰაყი": 1645, "ზონა": 1646, "წანგა": 1647, "ლუნგის": 1648, "ენკომო": 1649, "ლინგან": 1650, "მანგა": 1651, "უკა": 1652, "სიკა": 1653, "ლუმ": 1654, "ნაყე": 1655, "ტჰეტჰე": 1656, "ცედო": 1657, "ცინგა": 1658, "ფუმანეკა": 1659, "Ⴓკუ": 1660, "მფო": 1661, "წაკჰე": 1662, "ბუსო": 1663, "ქაკუ": 1664, "ფუტსჰანე": 1665, "ცალუ": 1666, "უკუნქ": 1667, "სელ": 1668, "კუზო": 1669, "ლწანა": 1670, "ფიკ": 1671, "ქჰუბე": 1672, "ხელელა": 1673, "ჯა": 1674, "ლამა": 1675, "ზაზი": 1676, "ლილეყო": 1677, "ინტეტჰო": 1678, "ჰლან": 1679, "პალა": 1680, "19": 1681, "წომ": 1682, "ხუ": 1683, "კწენზეკა": 1684, "პჰულო": 1685, "ნდლელა": 1686, "ცჰუ": 1687, "კულა": 1688, "კუყე": 1689 }, "merges": [ "t h", "i n", "th e", "a n", "e r", "o u", "r e", "o n", "a t", "e d", "e n", "t o", "in g", "an d", "i s", "a s", "a l", "o r", "o f", "a r", "i t", "e s", "h e", "s t", "l e", "o m", "s e", "b e", "a d", "o w", "l y", "c h", "w h", "th at", "y ou", "l i", "v e", "a c", "t i", "l d", "m e", "w as", "g h", "i d", "l l", "w i", "en t", "f or", "a y", "r o", "v er", "i c", "h er", "k e", "h is", "n o", "u t", "u n", "i r", "l o", "w e", "r i", "h a", "wi th", "gh t", "ou t", "i m", "i on", "al l", "a b", "on e", "n e", "g e", "ou ld", "t er", "m o", "h ad", "c e", "s he", "g o", "s h", "u r", "a m", "s o", "p e", "m y", "d e", "a re", "b ut", "om e", "f r", "the r", "f e", "s u", "d o", "c on", "t e", "a in", "er e", "p o", "i f", "the y", "u s", "a g", "t r", "n ow", "ou n", "th is", "ha ve", "no t", "s a", "i l", "u p", "th ing", "fr om", "a p", "h im", "ac k", "at ion", "an t", "ou r", "o p", "li ke", "u st", "es s", "b o", "o k", "u l", "in d", "e x", "c om", "s ome", "the re", "er s", "c o", "re s", "m an", "ar d", "p l", "w or", "w ay", "ti on", "f o", "c a", "w ere", "b y", "at e", "p ro", "t ed", "oun d", "ow n", "w ould", "t s", "wh at", "q u", "al ly", "i ght", "c k", "g r", "wh en", "v en", "c an", "ou gh", "in e", "en d", "p er", "ou s", "o d", "id e", "k now", "t y", "ver y", "s i", "a k", "wh o", "ab out", "i ll", "the m", "es t", "re d", "y e", "c ould", "on g", "you r", "the ir", "e m", "j ust", "o ther", "in to", "an y", "wh i", "u m", "t w", "as t", "d er", "d id", "i e", "be en", "ac e", "in k", "it y", "b ack", "t ing", "b r", "mo re", "a ke", "p p", "the n", "s p", "e l", "u se", "b l", "sa id", "o ver", "ge t", "ɑ ː", "i ː", "u ː", "ɜ ː", "ɔ ː", "o ː", "e ɪ", "o ʊ", "a ɪ", "a ʊ", "ɔ ɪ", "d ʒ", "t ʃ", "ɪ ŋ", "ᵻ d", "ˈ iː", "ˌ iː", "ˈ ɪ", "ˌ ɪ", "ˈ eɪ", "ˌ eɪ", "ˈ ɛ", "ˌ ɛ", "ˈ æ", "ˌ æ", "ˈ ɑː", "ˌ ɑː", "ˈ ɔː", "ˌ ɔː", "oː ɹ", "ˈ oːɹ", "ˌ oːɹ", "ˈ oʊ", "ˌ oʊ", "ˈ ʊ", "ˌ ʊ", "ˈ uː", "ˌ uː", "ˈ ɜː", "ˌ ɜː", "ˈ ʌ", "ˌ ʌ", "ˈ aɪ", "ˌ aɪ", "ˈ aʊ", "ˌ aʊ", "ˈ ɔɪ", "ˌ ɔɪ", "ˈ ɚ", "ˌ ɐ" ], "language": "xh" } }