slm-tiny-stories / tokenizer.json
Eric Houzelle
Initial commit
c64cf6f
{
"stoi": {
"[PAD]": 0,
" ": 1,
"!": 2,
"\"": 3,
"#": 4,
"$": 5,
"%": 6,
"&": 7,
"'": 8,
"(": 9,
")": 10,
"*": 11,
"+": 12,
",": 13,
"-": 14,
".": 15,
"/": 16,
"0": 17,
"1": 18,
"2": 19,
"3": 20,
"4": 21,
"5": 22,
"6": 23,
"7": 24,
"8": 25,
"9": 26,
":": 27,
";": 28,
"<": 29,
"=": 30,
">": 31,
"?": 32,
"@": 33,
"A": 34,
"B": 35,
"C": 36,
"D": 37,
"E": 38,
"F": 39,
"G": 40,
"H": 41,
"I": 42,
"J": 43,
"K": 44,
"L": 45,
"M": 46,
"N": 47,
"O": 48,
"P": 49,
"Q": 50,
"R": 51,
"S": 52,
"T": 53,
"U": 54,
"V": 55,
"W": 56,
"X": 57,
"Y": 58,
"Z": 59,
"[": 60,
"\\": 61,
"]": 62,
"^": 63,
"_": 64,
"`": 65,
"a": 66,
"b": 67,
"c": 68,
"d": 69,
"e": 70,
"f": 71,
"g": 72,
"h": 73,
"i": 74,
"j": 75,
"k": 76,
"l": 77,
"m": 78,
"n": 79,
"o": 80,
"p": 81,
"q": 82,
"r": 83,
"s": 84,
"t": 85,
"u": 86,
"v": 87,
"w": 88,
"x": 89,
"y": 90,
"z": 91,
"{": 92,
"|": 93,
"}": 94,
"~": 95,
"": 96,
" ": 97,
"¡": 98,
"£": 99,
"§": 100,
"¨": 101,
"©": 102,
"«": 103,
"®": 104,
"¯": 105,
"°": 106,
"±": 107,
"²": 108,
"³": 109,
"´": 110,
"µ": 111,
"·": 112,
"º": 113,
"»": 114,
"¼": 115,
"½": 116,
"¾": 117,
"¿": 118,
"À": 119,
"Á": 120,
"Â": 121,
"Ä": 122,
"Å": 123,
"Æ": 124,
"Ç": 125,
"È": 126,
"É": 127,
"Ê": 128,
"Ë": 129,
"Í": 130,
"Î": 131,
"Ï": 132,
"Ð": 133,
"Ñ": 134,
"Ò": 135,
"Ó": 136,
"Ô": 137,
"Õ": 138,
"Ö": 139,
"×": 140,
"Ø": 141,
"Ú": 142,
"Û": 143,
"Ü": 144,
"Þ": 145,
"ß": 146,
"à": 147,
"á": 148,
"â": 149,
"ã": 150,
"ä": 151,
"å": 152,
"æ": 153,
"ç": 154,
"è": 155,
"é": 156,
"ê": 157,
"ë": 158,
"ì": 159,
"í": 160,
"î": 161,
"ï": 162,
"ð": 163,
"ñ": 164,
"ò": 165,
"ó": 166,
"ô": 167,
"õ": 168,
"ö": 169,
"÷": 170,
"ø": 171,
"ù": 172,
"ú": 173,
"û": 174,
"ü": 175,
"ý": 176,
"þ": 177,
"ÿ": 178,
"Ā": 179,
"ā": 180,
"Ă": 181,
"ă": 182,
"ą": 183,
"Ć": 184,
"ć": 185,
"ĉ": 186,
"ċ": 187,
"Č": 188,
"č": 189,
"ď": 190,
"Đ": 191,
"đ": 192,
"Ē": 193,
"ē": 194,
"Ĕ": 195,
"ĕ": 196,
"Ė": 197,
"ė": 198,
"ę": 199,
"ě": 200,
"ĝ": 201,
"Ğ": 202,
"ğ": 203,
"Ġ": 204,
"ġ": 205,
"ĥ": 206,
"Ħ": 207,
"ħ": 208,
"ĩ": 209,
"Ī": 210,
"ī": 211,
"ĭ": 212,
"İ": 213,
"ı": 214,
"IJ": 215,
"ĵ": 216,
"ķ": 217,
"ĺ": 218,
"ļ": 219,
"Ľ": 220,
"ľ": 221,
"Ł": 222,
"ł": 223,
"ń": 224,
"ņ": 225,
"ň": 226,
"ŋ": 227,
"Ō": 228,
"ō": 229,
"ŏ": 230,
"Ő": 231,
"ő": 232,
"Œ": 233,
"œ": 234,
"ŗ": 235,
"ř": 236,
"Ś": 237,
"ś": 238,
"Ŝ": 239,
"ŝ": 240,
"Ş": 241,
"ş": 242,
"Š": 243,
"š": 244,
"ţ": 245,
"ť": 246,
"ũ": 247,
"ū": 248,
"ŭ": 249,
"ů": 250,
"Ű": 251,
"ű": 252,
"ų": 253,
"ŵ": 254,
"ŷ": 255,
"Ÿ": 256,
"ź": 257,
"Ż": 258,
"ż": 259,
"Ž": 260,
"ž": 261,
"ſ": 262,
"Ǝ": 263,
"Ə": 264,
"ƒ": 265,
"ơ": 266,
"ư": 267,
"ƴ": 268,
"ǎ": 269,
"ǐ": 270,
"ǒ": 271,
"ǔ": 272,
"ǘ": 273,
"ǝ": 274,
"ǣ": 275,
"Ǧ": 276,
"ǧ": 277,
"ǫ": 278,
"ǵ": 279,
"ȏ": 280,
"Ș": 281,
"ș": 282,
"Ț": 283,
"ț": 284,
"Ȣ": 285,
"ȷ": 286,
"Ƀ": 287,
"ɒ": 288,
"ɓ": 289,
"ɔ": 290,
"ə": 291,
"ɚ": 292,
"ɛ": 293,
"ɡ": 294,
"ɣ": 295,
"ɪ": 296,
"ɬ": 297,
"ɯ": 298,
"ɲ": 299,
"ɳ": 300,
"ɾ": 301,
"ʀ": 302,
"ʁ": 303,
"ʂ": 304,
"ʃ": 305,
"ʊ": 306,
"ʋ": 307,
"ʎ": 308,
"ʒ": 309,
"ʔ": 310,
"ʰ": 311,
"ʲ": 312,
"ʳ": 313,
"ʷ": 314,
"ʹ": 315,
"ʻ": 316,
"ʼ": 317,
"ʾ": 318,
"ʿ": 319,
"ˈ": 320,
"ˌ": 321,
"ː": 322,
"ˑ": 323,
"˘": 324,
"ˤ": 325,
"˥": 326,
"˧": 327,
"́": 328,
"̃": 329,
"̄": 330,
"̍": 331,
"̑": 332,
"̠": 333,
"̥": 334,
"̩": 335,
"̮": 336,
"̯": 337,
"͡": 338,
"΄": 339,
"Ά": 340,
"Έ": 341,
"Ό": 342,
"Ύ": 343,
"ΐ": 344,
"Α": 345,
"Β": 346,
"Γ": 347,
"Δ": 348,
"Ε": 349,
"Ζ": 350,
"Η": 351,
"Θ": 352,
"Ι": 353,
"Κ": 354,
"Λ": 355,
"Μ": 356,
"Ν": 357,
"Ξ": 358,
"Ο": 359,
"Π": 360,
"Ρ": 361,
"Σ": 362,
"Τ": 363,
"Υ": 364,
"Φ": 365,
"Χ": 366,
"Ψ": 367,
"Ω": 368,
"ά": 369,
"έ": 370,
"ή": 371,
"ί": 372,
"α": 373,
"β": 374,
"γ": 375,
"δ": 376,
"ε": 377,
"ζ": 378,
"η": 379,
"θ": 380,
"ι": 381,
"κ": 382,
"λ": 383,
"μ": 384,
"ν": 385,
"ξ": 386,
"ο": 387,
"π": 388,
"ρ": 389,
"ς": 390,
"σ": 391,
"τ": 392,
"υ": 393,
"φ": 394,
"χ": 395,
"ψ": 396,
"ω": 397,
"ό": 398,
"ύ": 399,
"ώ": 400,
"ϐ": 401,
"ϑ": 402,
"ϕ": 403,
"ϗ": 404,
"ϛ": 405,
"ϰ": 406,
"ϳ": 407,
"Ϲ": 408,
"Ђ": 409,
"І": 410,
"Ј": 411,
"Џ": 412,
"А": 413,
"Б": 414,
"В": 415,
"Г": 416,
"Д": 417,
"Е": 418,
"Ж": 419,
"З": 420,
"И": 421,
"К": 422,
"Л": 423,
"М": 424,
"Н": 425,
"О": 426,
"П": 427,
"Р": 428,
"С": 429,
"Т": 430,
"У": 431,
"Ф": 432,
"Х": 433,
"Ц": 434,
"Ч": 435,
"Ш": 436,
"Ю": 437,
"Я": 438,
"а": 439,
"б": 440,
"в": 441,
"г": 442,
"д": 443,
"е": 444,
"ж": 445,
"з": 446,
"и": 447,
"й": 448,
"к": 449,
"л": 450,
"м": 451,
"н": 452,
"о": 453,
"п": 454,
"р": 455,
"с": 456,
"т": 457,
"у": 458,
"ф": 459,
"х": 460,
"ц": 461,
"ч": 462,
"ш": 463,
"щ": 464,
"ъ": 465,
"ы": 466,
"ь": 467,
"э": 468,
"я": 469,
"ё": 470,
"ђ": 471,
"і": 472,
"ї": 473,
"ј": 474,
"ћ": 475,
"ў": 476,
"ѧ": 477,
"҆": 478,
"Ӏ": 479,
"ӏ": 480,
"Կ": 481,
"Ք": 482,
"Օ": 483,
"ա": 484,
"ե": 485,
"է": 486,
"թ": 487,
"ի": 488,
"լ": 489,
"կ": 490,
"հ": 491,
"մ": 492,
"յ": 493,
"ն": 494,
"ո": 495,
"ս": 496,
"վ": 497,
"տ": 498,
"ր": 499,
"ց": 500,
"ւ": 501,
"ְ": 502,
"ֱ": 503,
"ֲ": 504,
"ִ": 505,
"ֶ": 506,
"ַ": 507,
"ָ": 508,
"ֹ": 509,
"ּ": 510,
"ֿ": 511,
"ׁ": 512,
"א": 513,
"ב": 514,
"ג": 515,
"ד": 516,
"ה": 517,
"ו": 518,
"ז": 519,
"ח": 520,
"ט": 521,
"י": 522,
"ך": 523,
"כ": 524,
"ל": 525,
"ם": 526,
"מ": 527,
"ן": 528,
"נ": 529,
"ס": 530,
"ע": 531,
"ף": 532,
"פ": 533,
"צ": 534,
"ק": 535,
"ר": 536,
"ש": 537,
"ת": 538,
"״": 539,
"،": 540,
"ء": 541,
"آ": 542,
"أ": 543,
"ؤ": 544,
"إ": 545,
"ئ": 546,
"ا": 547,
"ب": 548,
"ة": 549,
"ت": 550,
"ث": 551,
"ج": 552,
"ح": 553,
"خ": 554,
"د": 555,
"ذ": 556,
"ر": 557,
"ز": 558,
"س": 559,
"ش": 560,
"ص": 561,
"ض": 562,
"ط": 563,
"ع": 564,
"غ": 565,
"ـ": 566,
"ف": 567,
"ق": 568,
"ك": 569,
"ل": 570,
"م": 571,
"ن": 572,
"ه": 573,
"و": 574,
"ى": 575,
"ي": 576,
"َ": 577,
"ُ": 578,
"ِ": 579,
"ّ": 580,
"ْ": 581,
"٠": 582,
"١": 583,
"٢": 584,
"٣": 585,
"٤": 586,
"٥": 587,
"٦": 588,
"٧": 589,
"٨": 590,
"٩": 591,
"ٰ": 592,
"ٱ": 593,
"ک": 594,
"ہ": 595,
"ی": 596,
"ە": 597,
"ܐ": 598,
"ܒ": 599,
"ܕ": 600,
"ܚ": 601,
"ܝ": 602,
"ܡ": 603,
"ܢ": 604,
"ܥ": 605,
"ܨ": 606,
"ܪ": 607,
"ܬ": 608,
"ं": 609,
"अ": 610,
"आ": 611,
"उ": 612,
"क": 613,
"ख": 614,
"ग": 615,
"ज": 616,
"ट": 617,
"ण": 618,
"त": 619,
"थ": 620,
"द": 621,
"ध": 622,
"न": 623,
"प": 624,
"ब": 625,
"भ": 626,
"म": 627,
"य": 628,
"र": 629,
"व": 630,
"श": 631,
"ष": 632,
"स": 633,
"ह": 634,
"ा": 635,
"ि": 636,
"ु": 637,
"ृ": 638,
"े": 639,
"ै": 640,
"ॉ": 641,
"ो": 642,
"ौ": 643,
"्": 644,
"ॐ": 645,
"গ": 646,
"জ": 647,
"ব": 648,
"ভ": 649,
"ল": 650,
"া": 651,
"ি": 652,
"ে": 653,
"ก": 654,
"ค": 655,
"ง": 656,
"จ": 657,
"ถ": 658,
"ท": 659,
"ธ": 660,
"น": 661,
"บ": 662,
"ป": 663,
"พ": 664,
"ฟ": 665,
"ม": 666,
"ย": 667,
"ร": 668,
"ฤ": 669,
"ว": 670,
"ศ": 671,
"ห": 672,
"อ": 673,
"ะ": 674,
"ั": 675,
"า": 676,
"ี": 677,
"ุ": 678,
"฿": 679,
"เ": 680,
"แ": 681,
"ไ": 682,
"่": 683,
"้": 684,
"ງ": 685,
"ນ": 686,
"ບ": 687,
"ມ": 688,
"ອ": 689,
"າ": 690,
"ື": 691,
"ເ": 692,
"້": 693,
"ག": 694,
"ད": 695,
"ཡ": 696,
"ར": 697,
"ུ": 698,
"ྒ": 699,
"ྔ": 700,
"က": 701,
"င": 702,
"ည": 703,
"တ": 704,
"ဒ": 705,
"န": 706,
"ပ": 707,
"ယ": 708,
"သ": 709,
"ိ": 710,
"ီ": 711,
"ု": 712,
"ေ": 713,
"း": 714,
"်": 715,
"ြ": 716,
"ა": 717,
"ბ": 718,
"ე": 719,
"ვ": 720,
"ი": 721,
"კ": 722,
"ლ": 723,
"მ": 724,
"ნ": 725,
"ო": 726,
"პ": 727,
"რ": 728,
"ს": 729,
"ტ": 730,
"უ": 731,
"ხ": 732,
"ሃ": 733,
"ል": 734,
"መ": 735,
"ም": 736,
"ረ": 737,
"ራ": 738,
"ር": 739,
"ስ": 740,
"ሽ": 741,
"ቁ": 742,
"ባ": 743,
"ቤ": 744,
"ብ": 745,
"ተ": 746,
"ን": 747,
"አ": 748,
"ኤ": 749,
"እ": 750,
"ከ": 751,
"ዓ": 752,
"ይ": 753,
"ደ": 754,
"ጣ": 755,
"ጥ": 756,
"ፊ": 757,
"ᑭ": 758,
"ᒪ": 759,
"ᗩ": 760,
"ᚢ": 761,
"ᚦ": 762,
"ᚱ": 763,
"ᚷ": 764,
"ᚹ": 765,
"ᚺ": 766,
"ᚼ": 767,
"ᛁ": 768,
"ᛒ": 769,
"ᛚ": 770,
"ᛞ": 771,
"ᛟ": 772,
"ᬩ": 773,
"ᬮ": 774,
"ᬶ": 775,
"ᵈ": 776,
"ᵉ": 777,
"ḍ": 778,
"Ḏ": 779,
"ḏ": 780,
"ḑ": 781,
"ḗ": 782,
"ḣ": 783,
"Ḥ": 784,
"ḥ": 785,
"Ḧ": 786,
"Ḫ": 787,
"ḫ": 788,
"ḯ": 789,
"ḱ": 790,
"ḳ": 791,
"ṃ": 792,
"ṅ": 793,
"ṇ": 794,
"ṉ": 795,
"ṓ": 796,
"Ṛ": 797,
"ṛ": 798,
"ṟ": 799,
"Ṣ": 800,
"ṣ": 801,
"Ṭ": 802,
"ṭ": 803,
"ṯ": 804,
"ṷ": 805,
"ẞ": 806,
"Ạ": 807,
"ạ": 808,
"ả": 809,
"Ấ": 810,
"ấ": 811,
"ầ": 812,
"ẩ": 813,
"ậ": 814,
"ắ": 815,
"ằ": 816,
"ẵ": 817,
"ặ": 818,
"ế": 819,
"ề": 820,
"ể": 821,
"ễ": 822,
"ệ": 823,
"ị": 824,
"ọ": 825,
"ố": 826,
"ồ": 827,
"ổ": 828,
"ộ": 829,
"ớ": 830,
"ờ": 831,
"ỡ": 832,
"ụ": 833,
"ủ": 834,
"ứ": 835,
"ử": 836,
"ữ": 837,
"ự": 838,
"ỳ": 839,
"ỹ": 840,
"ἀ": 841,
"ἁ": 842,
"ἄ": 843,
"ἅ": 844,
"Ἀ": 845,
"Ἄ": 846,
"Ἅ": 847,
"ἐ": 848,
"ἔ": 849,
"ἕ": 850,
"Ἐ": 851,
"Ἕ": 852,
"ἡ": 853,
"ἤ": 854,
"Ἠ": 855,
"Ἥ": 856,
"ἰ": 857,
"ἴ": 858,
"ἵ": 859,
"ἶ": 860,
"Ἰ": 861,
"Ἱ": 862,
"Ἶ": 863,
"ὁ": 864,
"ὄ": 865,
"ὅ": 866,
"Ὀ": 867,
"ὐ": 868,
"ὑ": 869,
"ὔ": 870,
"ὕ": 871,
"ὖ": 872,
"ὗ": 873,
"Ὕ": 874,
"ὠ": 875,
"ὡ": 876,
"ὴ": 877,
"ὶ": 878,
"ὸ": 879,
"ὺ": 880,
"ὼ": 881,
"ᾍ": 882,
"ᾧ": 883,
"ᾱ": 884,
"ᾶ": 885,
"᾿": 886,
"ῃ": 887,
"ῆ": 888,
"ῖ": 889,
"ῠ": 890,
"ῤ": 891,
"ῥ": 892,
"ῦ": 893,
"Ῥ": 894,
"ῳ": 895,
"ῶ": 896,
"ῷ": 897,
" ": 898,
" ": 899,
"‌": 900,
"‐": 901,
"‑": 902,
"‒": 903,
"–": 904,
"—": 905,
"―": 906,
"‖": 907,
"‘": 908,
"’": 909,
"‚": 910,
"“": 911,
"”": 912,
"„": 913,
"‟": 914,
"†": 915,
"•": 916,
"…": 917,
" ": 918,
"‰": 919,
"′": 920,
"″": 921,
"‹": 922,
"›": 923,
"‿": 924,
"⁄": 925,
"⁣": 926,
"⁰": 927,
"⁶": 928,
"⁷": 929,
"₁": 930,
"₂": 931,
"₦": 932,
"€": 933,
"₿": 934,
"ℏ": 935,
"ℚ": 936,
"ℤ": 937,
"ↀ": 938,
"ↁ": 939,
"ↂ": 940,
"Ↄ": 941,
"ↄ": 942,
"←": 943,
"→": 944,
"↓": 945,
"↔": 946,
"↗": 947,
"↘": 948,
"↵": 949,
"⇒": 950,
"∂": 951,
"∅": 952,
"−": 953,
"√": 954,
"∞": 955,
"∧": 956,
"∼": 957,
"≈": 958,
"≠": 959,
"≤": 960,
"≥": 961,
"⊕": 962,
"⊗": 963,
"⋅": 964,
"⋈": 965,
"⋔": 966,
"─": 967,
"▄": 968,
"◌": 969,
"☉": 970,
"☥": 971,
"☧": 972,
"☿": 973,
"♀": 974,
"♁": 975,
"♂": 976,
"♃": 977,
"♄": 978,
"♆": 979,
"♇": 980,
"♈": 981,
"♊": 982,
"♎": 983,
"♏": 984,
"♐": 985,
"♑": 986,
"♒": 987,
"♓": 988,
"♯": 989,
"⚥": 990,
"➜": 991,
"⟶": 992,
"⯓": 993,
"ⲁ": 994,
"ⲉ": 995,
"ⲓ": 996,
"ⲟ": 997,
"ⲣ": 998,
"ⲫ": 999,
"ⴰ": 1000,
"ⴱ": 1001,
"ⴵ": 1002,
"ⴷ": 1003,
"ⴽ": 1004,
"ⵀ": 1005,
"ⵃ": 1006,
"ⵄ": 1007,
"ⵇ": 1008,
"ⵈ": 1009,
"ⵉ": 1010,
"ⵊ": 1011,
"ⵍ": 1012,
"ⵎ": 1013,
"ⵏ": 1014,
"ⵓ": 1015,
"ⵔ": 1016,
"ⵖ": 1017,
"ⵗ": 1018,
"ⵙ": 1019,
"ⵛ": 1020,
"ⵜ": 1021,
"ⵡ": 1022,
"ⵢ": 1023,
"ⵣ": 1024,
"《": 1025,
"》": 1026,
"「": 1027,
"」": 1028,
"『": 1029,
"』": 1030,
"う": 1031,
"か": 1032,
"け": 1033,
"し": 1034,
"じ": 1035,
"せ": 1036,
"だ": 1037,
"っ": 1038,
"つ": 1039,
"で": 1040,
"な": 1041,
"ね": 1042,
"の": 1043,
"ぶ": 1044,
"ま": 1045,
"る": 1046,
"わ": 1047,
"ん": 1048,
"ア": 1049,
"イ": 1050,
"ウ": 1051,
"ク": 1052,
"ゴ": 1053,
"ス": 1054,
"ズ": 1055,
"タ": 1056,
"チ": 1057,
"ッ": 1058,
"ト": 1059,
"ド": 1060,
"パ": 1061,
"フ": 1062,
"ホ": 1063,
"ポ": 1064,
"ミ": 1065,
"ム": 1066,
"ュ": 1067,
"ョ": 1068,
"ラ": 1069,
"リ": 1070,
"ル": 1071,
"ン": 1072,
"・": 1073,
"ー": 1074,
"一": 1075,
"七": 1076,
"万": 1077,
"三": 1078,
"上": 1079,
"不": 1080,
"东": 1081,
"个": 1082,
"中": 1083,
"之": 1084,
"乐": 1085,
"书": 1086,
"乳": 1087,
"乾": 1088,
"事": 1089,
"五": 1090,
"京": 1091,
"亭": 1092,
"人": 1093,
"仁": 1094,
"仏": 1095,
"令": 1096,
"伝": 1097,
"佑": 1098,
"体": 1099,
"佛": 1100,
"來": 1101,
"信": 1102,
"倫": 1103,
"儒": 1104,
"元": 1105,
"光": 1106,
"兜": 1107,
"公": 1108,
"共": 1109,
"其": 1110,
"养": 1111,
"内": 1112,
"军": 1113,
"冲": 1114,
"刘": 1115,
"别": 1116,
"包": 1117,
"化": 1118,
"北": 1119,
"区": 1120,
"医": 1121,
"區": 1122,
"十": 1123,
"卍": 1124,
"华": 1125,
"卐": 1126,
"博": 1127,
"卫": 1128,
"印": 1129,
"原": 1130,
"参": 1131,
"友": 1132,
"台": 1133,
"史": 1134,
"号": 1135,
"司": 1136,
"周": 1137,
"和": 1138,
"哥": 1139,
"哲": 1140,
"商": 1141,
"因": 1142,
"团": 1143,
"园": 1144,
"国": 1145,
"國": 1146,
"圍": 1147,
"團": 1148,
"地": 1149,
"坤": 1150,
"城": 1151,
"基": 1152,
"外": 1153,
"大": 1154,
"天": 1155,
"太": 1156,
"子": 1157,
"字": 1158,
"孙": 1159,
"学": 1160,
"學": 1161,
"宁": 1162,
"宇": 1163,
"宗": 1164,
"家": 1165,
"密": 1166,
"寺": 1167,
"寿": 1168,
"對": 1169,
"小": 1170,
"少": 1171,
"尔": 1172,
"属": 1173,
"山": 1174,
"岸": 1175,
"州": 1176,
"巴": 1177,
"市": 1178,
"希": 1179,
"帖": 1180,
"帝": 1181,
"帶": 1182,
"常": 1183,
"平": 1184,
"年": 1185,
"度": 1186,
"延": 1187,
"建": 1188,
"式": 1189,
"御": 1190,
"德": 1191,
"志": 1192,
"思": 1193,
"愿": 1194,
"成": 1195,
"户": 1196,
"手": 1197,
"指": 1198,
"排": 1199,
"摩": 1200,
"支": 1201,
"政": 1202,
"故": 1203,
"教": 1204,
"文": 1205,
"斯": 1206,
"方": 1207,
"於": 1208,
"族": 1209,
"日": 1210,
"明": 1211,
"易": 1212,
"星": 1213,
"春": 1214,
"普": 1215,
"書": 1216,
"會": 1217,
"月": 1218,
"朝": 1219,
"木": 1220,
"本": 1221,
"李": 1222,
"杏": 1223,
"杭": 1224,
"東": 1225,
"松": 1226,
"极": 1227,
"果": 1228,
"柑": 1229,
"树": 1230,
"桃": 1231,
"桑": 1232,
"棚": 1233,
"樂": 1234,
"樊": 1235,
"正": 1236,
"武": 1237,
"死": 1238,
"毛": 1239,
"民": 1240,
"气": 1241,
"氣": 1242,
"水": 1243,
"求": 1244,
"汉": 1245,
"江": 1246,
"決": 1247,
"沖": 1248,
"沪": 1249,
"河": 1250,
"治": 1251,
"泥": 1252,
"洮": 1253,
"洲": 1254,
"浦": 1255,
"海": 1256,
"清": 1257,
"渤": 1258,
"漢": 1259,
"漫": 1260,
"火": 1261,
"灵": 1262,
"热": 1263,
"照": 1264,
"熊": 1265,
"燒": 1266,
"牙": 1267,
"特": 1268,
"狼": 1269,
"猫": 1270,
"玄": 1271,
"理": 1272,
"璞": 1273,
"環": 1274,
"瓦": 1275,
"甘": 1276,
"生": 1277,
"甲": 1278,
"町": 1279,
"画": 1280,
"病": 1281,
"白": 1282,
"百": 1283,
"皇": 1284,
"目": 1285,
"直": 1286,
"省": 1287,
"真": 1288,
"眼": 1289,
"矗": 1290,
"础": 1291,
"磨": 1292,
"祖": 1293,
"神": 1294,
"福": 1295,
"科": 1296,
"穆": 1297,
"空": 1298,
"第": 1299,
"筑": 1300,
"粥": 1301,
"糖": 1302,
"紅": 1303,
"紙": 1304,
"素": 1305,
"綽": 1306,
"総": 1307,
"纲": 1308,
"经": 1309,
"络": 1310,
"罪": 1311,
"群": 1312,
"老": 1313,
"肉": 1314,
"肺": 1315,
"肾": 1316,
"胡": 1317,
"脚": 1318,
"腑": 1319,
"腰": 1320,
"自": 1321,
"臺": 1322,
"花": 1323,
"英": 1324,
"草": 1325,
"華": 1326,
"萬": 1327,
"蒿": 1328,
"蔡": 1329,
"藏": 1330,
"蛮": 1331,
"蟹": 1332,
"蠻": 1333,
"行": 1334,
"衍": 1335,
"衛": 1336,
"西": 1337,
"览": 1338,
"解": 1339,
"訓": 1340,
"記": 1341,
"設": 1342,
"証": 1343,
"語": 1344,
"議": 1345,
"论": 1346,
"语": 1347,
"象": 1348,
"貘": 1349,
"赞": 1350,
"起": 1351,
"趙": 1352,
"路": 1353,
"軍": 1354,
"輪": 1355,
"辖": 1356,
"辰": 1357,
"辽": 1358,
"迪": 1359,
"迷": 1360,
"通": 1361,
"道": 1362,
"達": 1363,
"那": 1364,
"邪": 1365,
"部": 1366,
"郭": 1367,
"鄒": 1368,
"酒": 1369,
"醋": 1370,
"释": 1371,
"里": 1372,
"金": 1373,
"銀": 1374,
"錢": 1375,
"鎮": 1376,
"银": 1377,
"锦": 1378,
"长": 1379,
"阜": 1380,
"阝": 1381,
"防": 1382,
"阳": 1383,
"阴": 1384,
"阿": 1385,
"陀": 1386,
"院": 1387,
"除": 1388,
"陰": 1389,
"陸": 1390,
"陽": 1391,
"雄": 1392,
"集": 1393,
"雲": 1394,
"青": 1395,
"靬": 1396,
"音": 1397,
"願": 1398,
"類": 1399,
"风": 1400,
"食": 1401,
"馬": 1402,
"駆": 1403,
"骨": 1404,
"高": 1405,
"鬼": 1406,
"鮮": 1407,
"鵠": 1408,
"鸭": 1409,
"黄": 1410,
"黎": 1411,
"黑": 1412,
"龍": 1413,
"ꜣ": 1414,
"ꝍ": 1415,
"ꟾ": 1416,
"각": 1417,
"걸": 1418,
"공": 1419,
"국": 1420,
"글": 1421,
"길": 1422,
"노": 1423,
"농": 1424,
"단": 1425,
"담": 1426,
"대": 1427,
"도": 1428,
"동": 1429,
"두": 1430,
"뚜": 1431,
"로": 1432,
"말": 1433,
"명": 1434,
"무": 1435,
"문": 1436,
"민": 1437,
"발": 1438,
"밥": 1439,
"사": 1440,
"살": 1441,
"삼": 1442,
"상": 1443,
"선": 1444,
"성": 1445,
"식": 1446,
"어": 1447,
"영": 1448,
"음": 1449,
"의": 1450,
"인": 1451,
"작": 1452,
"장": 1453,
"정": 1454,
"조": 1455,
"주": 1456,
"지": 1457,
"창": 1458,
"학": 1459,
"한": 1460,
"헬": 1461,
"현": 1462,
"화": 1463,
"확": 1464,
"회": 1465,
"훈": 1466,
"": 1467,
"ff": 1468,
"fi": 1469,
"fl": 1470,
"ffi": 1471,
"ffl": 1472,
"st": 1473,
"﴾": 1474,
"︎": 1475,
"﹫": 1476,
"ﺱ": 1477,
"(": 1478,
"@": 1479,
"A": 1480,
"B": 1481,
"E": 1482,
"K": 1483,
"U": 1484,
"𐌲": 1485,
"𐌸": 1486,
"𐌿": 1487,
"📞": 1488
},
"itos": {
"0": "[PAD]",
"1": " ",
"2": "!",
"3": "\"",
"4": "#",
"5": "$",
"6": "%",
"7": "&",
"8": "'",
"9": "(",
"10": ")",
"11": "*",
"12": "+",
"13": ",",
"14": "-",
"15": ".",
"16": "/",
"17": "0",
"18": "1",
"19": "2",
"20": "3",
"21": "4",
"22": "5",
"23": "6",
"24": "7",
"25": "8",
"26": "9",
"27": ":",
"28": ";",
"29": "<",
"30": "=",
"31": ">",
"32": "?",
"33": "@",
"34": "A",
"35": "B",
"36": "C",
"37": "D",
"38": "E",
"39": "F",
"40": "G",
"41": "H",
"42": "I",
"43": "J",
"44": "K",
"45": "L",
"46": "M",
"47": "N",
"48": "O",
"49": "P",
"50": "Q",
"51": "R",
"52": "S",
"53": "T",
"54": "U",
"55": "V",
"56": "W",
"57": "X",
"58": "Y",
"59": "Z",
"60": "[",
"61": "\\",
"62": "]",
"63": "^",
"64": "_",
"65": "`",
"66": "a",
"67": "b",
"68": "c",
"69": "d",
"70": "e",
"71": "f",
"72": "g",
"73": "h",
"74": "i",
"75": "j",
"76": "k",
"77": "l",
"78": "m",
"79": "n",
"80": "o",
"81": "p",
"82": "q",
"83": "r",
"84": "s",
"85": "t",
"86": "u",
"87": "v",
"88": "w",
"89": "x",
"90": "y",
"91": "z",
"92": "{",
"93": "|",
"94": "}",
"95": "~",
"96": "",
"97": " ",
"98": "¡",
"99": "£",
"100": "§",
"101": "¨",
"102": "©",
"103": "«",
"104": "®",
"105": "¯",
"106": "°",
"107": "±",
"108": "²",
"109": "³",
"110": "´",
"111": "µ",
"112": "·",
"113": "º",
"114": "»",
"115": "¼",
"116": "½",
"117": "¾",
"118": "¿",
"119": "À",
"120": "Á",
"121": "Â",
"122": "Ä",
"123": "Å",
"124": "Æ",
"125": "Ç",
"126": "È",
"127": "É",
"128": "Ê",
"129": "Ë",
"130": "Í",
"131": "Î",
"132": "Ï",
"133": "Ð",
"134": "Ñ",
"135": "Ò",
"136": "Ó",
"137": "Ô",
"138": "Õ",
"139": "Ö",
"140": "×",
"141": "Ø",
"142": "Ú",
"143": "Û",
"144": "Ü",
"145": "Þ",
"146": "ß",
"147": "à",
"148": "á",
"149": "â",
"150": "ã",
"151": "ä",
"152": "å",
"153": "æ",
"154": "ç",
"155": "è",
"156": "é",
"157": "ê",
"158": "ë",
"159": "ì",
"160": "í",
"161": "î",
"162": "ï",
"163": "ð",
"164": "ñ",
"165": "ò",
"166": "ó",
"167": "ô",
"168": "õ",
"169": "ö",
"170": "÷",
"171": "ø",
"172": "ù",
"173": "ú",
"174": "û",
"175": "ü",
"176": "ý",
"177": "þ",
"178": "ÿ",
"179": "Ā",
"180": "ā",
"181": "Ă",
"182": "ă",
"183": "ą",
"184": "Ć",
"185": "ć",
"186": "ĉ",
"187": "ċ",
"188": "Č",
"189": "č",
"190": "ď",
"191": "Đ",
"192": "đ",
"193": "Ē",
"194": "ē",
"195": "Ĕ",
"196": "ĕ",
"197": "Ė",
"198": "ė",
"199": "ę",
"200": "ě",
"201": "ĝ",
"202": "Ğ",
"203": "ğ",
"204": "Ġ",
"205": "ġ",
"206": "ĥ",
"207": "Ħ",
"208": "ħ",
"209": "ĩ",
"210": "Ī",
"211": "ī",
"212": "ĭ",
"213": "İ",
"214": "ı",
"215": "IJ",
"216": "ĵ",
"217": "ķ",
"218": "ĺ",
"219": "ļ",
"220": "Ľ",
"221": "ľ",
"222": "Ł",
"223": "ł",
"224": "ń",
"225": "ņ",
"226": "ň",
"227": "ŋ",
"228": "Ō",
"229": "ō",
"230": "ŏ",
"231": "Ő",
"232": "ő",
"233": "Œ",
"234": "œ",
"235": "ŗ",
"236": "ř",
"237": "Ś",
"238": "ś",
"239": "Ŝ",
"240": "ŝ",
"241": "Ş",
"242": "ş",
"243": "Š",
"244": "š",
"245": "ţ",
"246": "ť",
"247": "ũ",
"248": "ū",
"249": "ŭ",
"250": "ů",
"251": "Ű",
"252": "ű",
"253": "ų",
"254": "ŵ",
"255": "ŷ",
"256": "Ÿ",
"257": "ź",
"258": "Ż",
"259": "ż",
"260": "Ž",
"261": "ž",
"262": "ſ",
"263": "Ǝ",
"264": "Ə",
"265": "ƒ",
"266": "ơ",
"267": "ư",
"268": "ƴ",
"269": "ǎ",
"270": "ǐ",
"271": "ǒ",
"272": "ǔ",
"273": "ǘ",
"274": "ǝ",
"275": "ǣ",
"276": "Ǧ",
"277": "ǧ",
"278": "ǫ",
"279": "ǵ",
"280": "ȏ",
"281": "Ș",
"282": "ș",
"283": "Ț",
"284": "ț",
"285": "Ȣ",
"286": "ȷ",
"287": "Ƀ",
"288": "ɒ",
"289": "ɓ",
"290": "ɔ",
"291": "ə",
"292": "ɚ",
"293": "ɛ",
"294": "ɡ",
"295": "ɣ",
"296": "ɪ",
"297": "ɬ",
"298": "ɯ",
"299": "ɲ",
"300": "ɳ",
"301": "ɾ",
"302": "ʀ",
"303": "ʁ",
"304": "ʂ",
"305": "ʃ",
"306": "ʊ",
"307": "ʋ",
"308": "ʎ",
"309": "ʒ",
"310": "ʔ",
"311": "ʰ",
"312": "ʲ",
"313": "ʳ",
"314": "ʷ",
"315": "ʹ",
"316": "ʻ",
"317": "ʼ",
"318": "ʾ",
"319": "ʿ",
"320": "ˈ",
"321": "ˌ",
"322": "ː",
"323": "ˑ",
"324": "˘",
"325": "ˤ",
"326": "˥",
"327": "˧",
"328": "́",
"329": "̃",
"330": "̄",
"331": "̍",
"332": "̑",
"333": "̠",
"334": "̥",
"335": "̩",
"336": "̮",
"337": "̯",
"338": "͡",
"339": "΄",
"340": "Ά",
"341": "Έ",
"342": "Ό",
"343": "Ύ",
"344": "ΐ",
"345": "Α",
"346": "Β",
"347": "Γ",
"348": "Δ",
"349": "Ε",
"350": "Ζ",
"351": "Η",
"352": "Θ",
"353": "Ι",
"354": "Κ",
"355": "Λ",
"356": "Μ",
"357": "Ν",
"358": "Ξ",
"359": "Ο",
"360": "Π",
"361": "Ρ",
"362": "Σ",
"363": "Τ",
"364": "Υ",
"365": "Φ",
"366": "Χ",
"367": "Ψ",
"368": "Ω",
"369": "ά",
"370": "έ",
"371": "ή",
"372": "ί",
"373": "α",
"374": "β",
"375": "γ",
"376": "δ",
"377": "ε",
"378": "ζ",
"379": "η",
"380": "θ",
"381": "ι",
"382": "κ",
"383": "λ",
"384": "μ",
"385": "ν",
"386": "ξ",
"387": "ο",
"388": "π",
"389": "ρ",
"390": "ς",
"391": "σ",
"392": "τ",
"393": "υ",
"394": "φ",
"395": "χ",
"396": "ψ",
"397": "ω",
"398": "ό",
"399": "ύ",
"400": "ώ",
"401": "ϐ",
"402": "ϑ",
"403": "ϕ",
"404": "ϗ",
"405": "ϛ",
"406": "ϰ",
"407": "ϳ",
"408": "Ϲ",
"409": "Ђ",
"410": "І",
"411": "Ј",
"412": "Џ",
"413": "А",
"414": "Б",
"415": "В",
"416": "Г",
"417": "Д",
"418": "Е",
"419": "Ж",
"420": "З",
"421": "И",
"422": "К",
"423": "Л",
"424": "М",
"425": "Н",
"426": "О",
"427": "П",
"428": "Р",
"429": "С",
"430": "Т",
"431": "У",
"432": "Ф",
"433": "Х",
"434": "Ц",
"435": "Ч",
"436": "Ш",
"437": "Ю",
"438": "Я",
"439": "а",
"440": "б",
"441": "в",
"442": "г",
"443": "д",
"444": "е",
"445": "ж",
"446": "з",
"447": "и",
"448": "й",
"449": "к",
"450": "л",
"451": "м",
"452": "н",
"453": "о",
"454": "п",
"455": "р",
"456": "с",
"457": "т",
"458": "у",
"459": "ф",
"460": "х",
"461": "ц",
"462": "ч",
"463": "ш",
"464": "щ",
"465": "ъ",
"466": "ы",
"467": "ь",
"468": "э",
"469": "я",
"470": "ё",
"471": "ђ",
"472": "і",
"473": "ї",
"474": "ј",
"475": "ћ",
"476": "ў",
"477": "ѧ",
"478": "҆",
"479": "Ӏ",
"480": "ӏ",
"481": "Կ",
"482": "Ք",
"483": "Օ",
"484": "ա",
"485": "ե",
"486": "է",
"487": "թ",
"488": "ի",
"489": "լ",
"490": "կ",
"491": "հ",
"492": "մ",
"493": "յ",
"494": "ն",
"495": "ո",
"496": "ս",
"497": "վ",
"498": "տ",
"499": "ր",
"500": "ց",
"501": "ւ",
"502": "ְ",
"503": "ֱ",
"504": "ֲ",
"505": "ִ",
"506": "ֶ",
"507": "ַ",
"508": "ָ",
"509": "ֹ",
"510": "ּ",
"511": "ֿ",
"512": "ׁ",
"513": "א",
"514": "ב",
"515": "ג",
"516": "ד",
"517": "ה",
"518": "ו",
"519": "ז",
"520": "ח",
"521": "ט",
"522": "י",
"523": "ך",
"524": "כ",
"525": "ל",
"526": "ם",
"527": "מ",
"528": "ן",
"529": "נ",
"530": "ס",
"531": "ע",
"532": "ף",
"533": "פ",
"534": "צ",
"535": "ק",
"536": "ר",
"537": "ש",
"538": "ת",
"539": "״",
"540": "،",
"541": "ء",
"542": "آ",
"543": "أ",
"544": "ؤ",
"545": "إ",
"546": "ئ",
"547": "ا",
"548": "ب",
"549": "ة",
"550": "ت",
"551": "ث",
"552": "ج",
"553": "ح",
"554": "خ",
"555": "د",
"556": "ذ",
"557": "ر",
"558": "ز",
"559": "س",
"560": "ش",
"561": "ص",
"562": "ض",
"563": "ط",
"564": "ع",
"565": "غ",
"566": "ـ",
"567": "ف",
"568": "ق",
"569": "ك",
"570": "ل",
"571": "م",
"572": "ن",
"573": "ه",
"574": "و",
"575": "ى",
"576": "ي",
"577": "َ",
"578": "ُ",
"579": "ِ",
"580": "ّ",
"581": "ْ",
"582": "٠",
"583": "١",
"584": "٢",
"585": "٣",
"586": "٤",
"587": "٥",
"588": "٦",
"589": "٧",
"590": "٨",
"591": "٩",
"592": "ٰ",
"593": "ٱ",
"594": "ک",
"595": "ہ",
"596": "ی",
"597": "ە",
"598": "ܐ",
"599": "ܒ",
"600": "ܕ",
"601": "ܚ",
"602": "ܝ",
"603": "ܡ",
"604": "ܢ",
"605": "ܥ",
"606": "ܨ",
"607": "ܪ",
"608": "ܬ",
"609": "ं",
"610": "अ",
"611": "आ",
"612": "उ",
"613": "क",
"614": "ख",
"615": "ग",
"616": "ज",
"617": "ट",
"618": "ण",
"619": "त",
"620": "थ",
"621": "द",
"622": "ध",
"623": "न",
"624": "प",
"625": "ब",
"626": "भ",
"627": "म",
"628": "य",
"629": "र",
"630": "व",
"631": "श",
"632": "ष",
"633": "स",
"634": "ह",
"635": "ा",
"636": "ि",
"637": "ु",
"638": "ृ",
"639": "े",
"640": "ै",
"641": "ॉ",
"642": "ो",
"643": "ौ",
"644": "्",
"645": "ॐ",
"646": "গ",
"647": "জ",
"648": "ব",
"649": "ভ",
"650": "ল",
"651": "া",
"652": "ি",
"653": "ে",
"654": "ก",
"655": "ค",
"656": "ง",
"657": "จ",
"658": "ถ",
"659": "ท",
"660": "ธ",
"661": "น",
"662": "บ",
"663": "ป",
"664": "พ",
"665": "ฟ",
"666": "ม",
"667": "ย",
"668": "ร",
"669": "ฤ",
"670": "ว",
"671": "ศ",
"672": "ห",
"673": "อ",
"674": "ะ",
"675": "ั",
"676": "า",
"677": "ี",
"678": "ุ",
"679": "฿",
"680": "เ",
"681": "แ",
"682": "ไ",
"683": "่",
"684": "้",
"685": "ງ",
"686": "ນ",
"687": "ບ",
"688": "ມ",
"689": "ອ",
"690": "າ",
"691": "ື",
"692": "ເ",
"693": "້",
"694": "ག",
"695": "ད",
"696": "ཡ",
"697": "ར",
"698": "ུ",
"699": "ྒ",
"700": "ྔ",
"701": "က",
"702": "င",
"703": "ည",
"704": "တ",
"705": "ဒ",
"706": "န",
"707": "ပ",
"708": "ယ",
"709": "သ",
"710": "ိ",
"711": "ီ",
"712": "ု",
"713": "ေ",
"714": "း",
"715": "်",
"716": "ြ",
"717": "ა",
"718": "ბ",
"719": "ე",
"720": "ვ",
"721": "ი",
"722": "კ",
"723": "ლ",
"724": "მ",
"725": "ნ",
"726": "ო",
"727": "პ",
"728": "რ",
"729": "ს",
"730": "ტ",
"731": "უ",
"732": "ხ",
"733": "ሃ",
"734": "ል",
"735": "መ",
"736": "ም",
"737": "ረ",
"738": "ራ",
"739": "ር",
"740": "ስ",
"741": "ሽ",
"742": "ቁ",
"743": "ባ",
"744": "ቤ",
"745": "ብ",
"746": "ተ",
"747": "ን",
"748": "አ",
"749": "ኤ",
"750": "እ",
"751": "ከ",
"752": "ዓ",
"753": "ይ",
"754": "ደ",
"755": "ጣ",
"756": "ጥ",
"757": "ፊ",
"758": "ᑭ",
"759": "ᒪ",
"760": "ᗩ",
"761": "ᚢ",
"762": "ᚦ",
"763": "ᚱ",
"764": "ᚷ",
"765": "ᚹ",
"766": "ᚺ",
"767": "ᚼ",
"768": "ᛁ",
"769": "ᛒ",
"770": "ᛚ",
"771": "ᛞ",
"772": "ᛟ",
"773": "ᬩ",
"774": "ᬮ",
"775": "ᬶ",
"776": "ᵈ",
"777": "ᵉ",
"778": "ḍ",
"779": "Ḏ",
"780": "ḏ",
"781": "ḑ",
"782": "ḗ",
"783": "ḣ",
"784": "Ḥ",
"785": "ḥ",
"786": "Ḧ",
"787": "Ḫ",
"788": "ḫ",
"789": "ḯ",
"790": "ḱ",
"791": "ḳ",
"792": "ṃ",
"793": "ṅ",
"794": "ṇ",
"795": "ṉ",
"796": "ṓ",
"797": "Ṛ",
"798": "ṛ",
"799": "ṟ",
"800": "Ṣ",
"801": "ṣ",
"802": "Ṭ",
"803": "ṭ",
"804": "ṯ",
"805": "ṷ",
"806": "ẞ",
"807": "Ạ",
"808": "ạ",
"809": "ả",
"810": "Ấ",
"811": "ấ",
"812": "ầ",
"813": "ẩ",
"814": "ậ",
"815": "ắ",
"816": "ằ",
"817": "ẵ",
"818": "ặ",
"819": "ế",
"820": "ề",
"821": "ể",
"822": "ễ",
"823": "ệ",
"824": "ị",
"825": "ọ",
"826": "ố",
"827": "ồ",
"828": "ổ",
"829": "ộ",
"830": "ớ",
"831": "ờ",
"832": "ỡ",
"833": "ụ",
"834": "ủ",
"835": "ứ",
"836": "ử",
"837": "ữ",
"838": "ự",
"839": "ỳ",
"840": "ỹ",
"841": "ἀ",
"842": "ἁ",
"843": "ἄ",
"844": "ἅ",
"845": "Ἀ",
"846": "Ἄ",
"847": "Ἅ",
"848": "ἐ",
"849": "ἔ",
"850": "ἕ",
"851": "Ἐ",
"852": "Ἕ",
"853": "ἡ",
"854": "ἤ",
"855": "Ἠ",
"856": "Ἥ",
"857": "ἰ",
"858": "ἴ",
"859": "ἵ",
"860": "ἶ",
"861": "Ἰ",
"862": "Ἱ",
"863": "Ἶ",
"864": "ὁ",
"865": "ὄ",
"866": "ὅ",
"867": "Ὀ",
"868": "ὐ",
"869": "ὑ",
"870": "ὔ",
"871": "ὕ",
"872": "ὖ",
"873": "ὗ",
"874": "Ὕ",
"875": "ὠ",
"876": "ὡ",
"877": "ὴ",
"878": "ὶ",
"879": "ὸ",
"880": "ὺ",
"881": "ὼ",
"882": "ᾍ",
"883": "ᾧ",
"884": "ᾱ",
"885": "ᾶ",
"886": "᾿",
"887": "ῃ",
"888": "ῆ",
"889": "ῖ",
"890": "ῠ",
"891": "ῤ",
"892": "ῥ",
"893": "ῦ",
"894": "Ῥ",
"895": "ῳ",
"896": "ῶ",
"897": "ῷ",
"898": " ",
"899": " ",
"900": "‌",
"901": "‐",
"902": "‑",
"903": "‒",
"904": "–",
"905": "—",
"906": "―",
"907": "‖",
"908": "‘",
"909": "’",
"910": "‚",
"911": "“",
"912": "”",
"913": "„",
"914": "‟",
"915": "†",
"916": "•",
"917": "…",
"918": " ",
"919": "‰",
"920": "′",
"921": "″",
"922": "‹",
"923": "›",
"924": "‿",
"925": "⁄",
"926": "⁣",
"927": "⁰",
"928": "⁶",
"929": "⁷",
"930": "₁",
"931": "₂",
"932": "₦",
"933": "€",
"934": "₿",
"935": "ℏ",
"936": "ℚ",
"937": "ℤ",
"938": "ↀ",
"939": "ↁ",
"940": "ↂ",
"941": "Ↄ",
"942": "ↄ",
"943": "←",
"944": "→",
"945": "↓",
"946": "↔",
"947": "↗",
"948": "↘",
"949": "↵",
"950": "⇒",
"951": "∂",
"952": "∅",
"953": "−",
"954": "√",
"955": "∞",
"956": "∧",
"957": "∼",
"958": "≈",
"959": "≠",
"960": "≤",
"961": "≥",
"962": "⊕",
"963": "⊗",
"964": "⋅",
"965": "⋈",
"966": "⋔",
"967": "─",
"968": "▄",
"969": "◌",
"970": "☉",
"971": "☥",
"972": "☧",
"973": "☿",
"974": "♀",
"975": "♁",
"976": "♂",
"977": "♃",
"978": "♄",
"979": "♆",
"980": "♇",
"981": "♈",
"982": "♊",
"983": "♎",
"984": "♏",
"985": "♐",
"986": "♑",
"987": "♒",
"988": "♓",
"989": "♯",
"990": "⚥",
"991": "➜",
"992": "⟶",
"993": "⯓",
"994": "ⲁ",
"995": "ⲉ",
"996": "ⲓ",
"997": "ⲟ",
"998": "ⲣ",
"999": "ⲫ",
"1000": "ⴰ",
"1001": "ⴱ",
"1002": "ⴵ",
"1003": "ⴷ",
"1004": "ⴽ",
"1005": "ⵀ",
"1006": "ⵃ",
"1007": "ⵄ",
"1008": "ⵇ",
"1009": "ⵈ",
"1010": "ⵉ",
"1011": "ⵊ",
"1012": "ⵍ",
"1013": "ⵎ",
"1014": "ⵏ",
"1015": "ⵓ",
"1016": "ⵔ",
"1017": "ⵖ",
"1018": "ⵗ",
"1019": "ⵙ",
"1020": "ⵛ",
"1021": "ⵜ",
"1022": "ⵡ",
"1023": "ⵢ",
"1024": "ⵣ",
"1025": "《",
"1026": "》",
"1027": "「",
"1028": "」",
"1029": "『",
"1030": "』",
"1031": "う",
"1032": "か",
"1033": "け",
"1034": "し",
"1035": "じ",
"1036": "せ",
"1037": "だ",
"1038": "っ",
"1039": "つ",
"1040": "で",
"1041": "な",
"1042": "ね",
"1043": "の",
"1044": "ぶ",
"1045": "ま",
"1046": "る",
"1047": "わ",
"1048": "ん",
"1049": "ア",
"1050": "イ",
"1051": "ウ",
"1052": "ク",
"1053": "ゴ",
"1054": "ス",
"1055": "ズ",
"1056": "タ",
"1057": "チ",
"1058": "ッ",
"1059": "ト",
"1060": "ド",
"1061": "パ",
"1062": "フ",
"1063": "ホ",
"1064": "ポ",
"1065": "ミ",
"1066": "ム",
"1067": "ュ",
"1068": "ョ",
"1069": "ラ",
"1070": "リ",
"1071": "ル",
"1072": "ン",
"1073": "・",
"1074": "ー",
"1075": "一",
"1076": "七",
"1077": "万",
"1078": "三",
"1079": "上",
"1080": "不",
"1081": "东",
"1082": "个",
"1083": "中",
"1084": "之",
"1085": "乐",
"1086": "书",
"1087": "乳",
"1088": "乾",
"1089": "事",
"1090": "五",
"1091": "京",
"1092": "亭",
"1093": "人",
"1094": "仁",
"1095": "仏",
"1096": "令",
"1097": "伝",
"1098": "佑",
"1099": "体",
"1100": "佛",
"1101": "來",
"1102": "信",
"1103": "倫",
"1104": "儒",
"1105": "元",
"1106": "光",
"1107": "兜",
"1108": "公",
"1109": "共",
"1110": "其",
"1111": "养",
"1112": "内",
"1113": "军",
"1114": "冲",
"1115": "刘",
"1116": "别",
"1117": "包",
"1118": "化",
"1119": "北",
"1120": "区",
"1121": "医",
"1122": "區",
"1123": "十",
"1124": "卍",
"1125": "华",
"1126": "卐",
"1127": "博",
"1128": "卫",
"1129": "印",
"1130": "原",
"1131": "参",
"1132": "友",
"1133": "台",
"1134": "史",
"1135": "号",
"1136": "司",
"1137": "周",
"1138": "和",
"1139": "哥",
"1140": "哲",
"1141": "商",
"1142": "因",
"1143": "团",
"1144": "园",
"1145": "国",
"1146": "國",
"1147": "圍",
"1148": "團",
"1149": "地",
"1150": "坤",
"1151": "城",
"1152": "基",
"1153": "外",
"1154": "大",
"1155": "天",
"1156": "太",
"1157": "子",
"1158": "字",
"1159": "孙",
"1160": "学",
"1161": "學",
"1162": "宁",
"1163": "宇",
"1164": "宗",
"1165": "家",
"1166": "密",
"1167": "寺",
"1168": "寿",
"1169": "對",
"1170": "小",
"1171": "少",
"1172": "尔",
"1173": "属",
"1174": "山",
"1175": "岸",
"1176": "州",
"1177": "巴",
"1178": "市",
"1179": "希",
"1180": "帖",
"1181": "帝",
"1182": "帶",
"1183": "常",
"1184": "平",
"1185": "年",
"1186": "度",
"1187": "延",
"1188": "建",
"1189": "式",
"1190": "御",
"1191": "德",
"1192": "志",
"1193": "思",
"1194": "愿",
"1195": "成",
"1196": "户",
"1197": "手",
"1198": "指",
"1199": "排",
"1200": "摩",
"1201": "支",
"1202": "政",
"1203": "故",
"1204": "教",
"1205": "文",
"1206": "斯",
"1207": "方",
"1208": "於",
"1209": "族",
"1210": "日",
"1211": "明",
"1212": "易",
"1213": "星",
"1214": "春",
"1215": "普",
"1216": "書",
"1217": "會",
"1218": "月",
"1219": "朝",
"1220": "木",
"1221": "本",
"1222": "李",
"1223": "杏",
"1224": "杭",
"1225": "東",
"1226": "松",
"1227": "极",
"1228": "果",
"1229": "柑",
"1230": "树",
"1231": "桃",
"1232": "桑",
"1233": "棚",
"1234": "樂",
"1235": "樊",
"1236": "正",
"1237": "武",
"1238": "死",
"1239": "毛",
"1240": "民",
"1241": "气",
"1242": "氣",
"1243": "水",
"1244": "求",
"1245": "汉",
"1246": "江",
"1247": "決",
"1248": "沖",
"1249": "沪",
"1250": "河",
"1251": "治",
"1252": "泥",
"1253": "洮",
"1254": "洲",
"1255": "浦",
"1256": "海",
"1257": "清",
"1258": "渤",
"1259": "漢",
"1260": "漫",
"1261": "火",
"1262": "灵",
"1263": "热",
"1264": "照",
"1265": "熊",
"1266": "燒",
"1267": "牙",
"1268": "特",
"1269": "狼",
"1270": "猫",
"1271": "玄",
"1272": "理",
"1273": "璞",
"1274": "環",
"1275": "瓦",
"1276": "甘",
"1277": "生",
"1278": "甲",
"1279": "町",
"1280": "画",
"1281": "病",
"1282": "白",
"1283": "百",
"1284": "皇",
"1285": "目",
"1286": "直",
"1287": "省",
"1288": "真",
"1289": "眼",
"1290": "矗",
"1291": "础",
"1292": "磨",
"1293": "祖",
"1294": "神",
"1295": "福",
"1296": "科",
"1297": "穆",
"1298": "空",
"1299": "第",
"1300": "筑",
"1301": "粥",
"1302": "糖",
"1303": "紅",
"1304": "紙",
"1305": "素",
"1306": "綽",
"1307": "総",
"1308": "纲",
"1309": "经",
"1310": "络",
"1311": "罪",
"1312": "群",
"1313": "老",
"1314": "肉",
"1315": "肺",
"1316": "肾",
"1317": "胡",
"1318": "脚",
"1319": "腑",
"1320": "腰",
"1321": "自",
"1322": "臺",
"1323": "花",
"1324": "英",
"1325": "草",
"1326": "華",
"1327": "萬",
"1328": "蒿",
"1329": "蔡",
"1330": "藏",
"1331": "蛮",
"1332": "蟹",
"1333": "蠻",
"1334": "行",
"1335": "衍",
"1336": "衛",
"1337": "西",
"1338": "览",
"1339": "解",
"1340": "訓",
"1341": "記",
"1342": "設",
"1343": "証",
"1344": "語",
"1345": "議",
"1346": "论",
"1347": "语",
"1348": "象",
"1349": "貘",
"1350": "赞",
"1351": "起",
"1352": "趙",
"1353": "路",
"1354": "軍",
"1355": "輪",
"1356": "辖",
"1357": "辰",
"1358": "辽",
"1359": "迪",
"1360": "迷",
"1361": "通",
"1362": "道",
"1363": "達",
"1364": "那",
"1365": "邪",
"1366": "部",
"1367": "郭",
"1368": "鄒",
"1369": "酒",
"1370": "醋",
"1371": "释",
"1372": "里",
"1373": "金",
"1374": "銀",
"1375": "錢",
"1376": "鎮",
"1377": "银",
"1378": "锦",
"1379": "长",
"1380": "阜",
"1381": "阝",
"1382": "防",
"1383": "阳",
"1384": "阴",
"1385": "阿",
"1386": "陀",
"1387": "院",
"1388": "除",
"1389": "陰",
"1390": "陸",
"1391": "陽",
"1392": "雄",
"1393": "集",
"1394": "雲",
"1395": "青",
"1396": "靬",
"1397": "音",
"1398": "願",
"1399": "類",
"1400": "风",
"1401": "食",
"1402": "馬",
"1403": "駆",
"1404": "骨",
"1405": "高",
"1406": "鬼",
"1407": "鮮",
"1408": "鵠",
"1409": "鸭",
"1410": "黄",
"1411": "黎",
"1412": "黑",
"1413": "龍",
"1414": "ꜣ",
"1415": "ꝍ",
"1416": "ꟾ",
"1417": "각",
"1418": "걸",
"1419": "공",
"1420": "국",
"1421": "글",
"1422": "길",
"1423": "노",
"1424": "농",
"1425": "단",
"1426": "담",
"1427": "대",
"1428": "도",
"1429": "동",
"1430": "두",
"1431": "뚜",
"1432": "로",
"1433": "말",
"1434": "명",
"1435": "무",
"1436": "문",
"1437": "민",
"1438": "발",
"1439": "밥",
"1440": "사",
"1441": "살",
"1442": "삼",
"1443": "상",
"1444": "선",
"1445": "성",
"1446": "식",
"1447": "어",
"1448": "영",
"1449": "음",
"1450": "의",
"1451": "인",
"1452": "작",
"1453": "장",
"1454": "정",
"1455": "조",
"1456": "주",
"1457": "지",
"1458": "창",
"1459": "학",
"1460": "한",
"1461": "헬",
"1462": "현",
"1463": "화",
"1464": "확",
"1465": "회",
"1466": "훈",
"1467": "",
"1468": "ff",
"1469": "fi",
"1470": "fl",
"1471": "ffi",
"1472": "ffl",
"1473": "st",
"1474": "﴾",
"1475": "︎",
"1476": "﹫",
"1477": "ﺱ",
"1478": "(",
"1479": "@",
"1480": "A",
"1481": "B",
"1482": "E",
"1483": "K",
"1484": "U",
"1485": "𐌲",
"1486": "𐌸",
"1487": "𐌿",
"1488": "📞"
},
"pad_token": "[PAD]"
}