assamese-ocr / assamese_char_tokenizer.json
Badnyal's picture
Upload assamese_char_tokenizer.json with huggingface_hub
be9b223 verified
[
"<pad>",
"<s>",
"</s>",
"<unk>",
"<OCR>",
"<lang_as>",
"া",
"ৰ",
"ি",
"ে",
"ক",
"ন",
"ত",
"ল",
"্",
"ব",
"ম",
"ো",
"ু",
"প",
"হ",
"ই",
"দ",
"স",
"।",
"য়",
"গ",
"ী",
"আ",
"জ",
"চ",
"ছ",
"ট",
"ৈ",
"ৱ",
"য",
"খ",
"এ",
",",
"ভ",
"ঁ",
"শ",
"-",
"'",
"ণ",
"ধ",
"থ",
"ও",
"অ",
"র",
"\"",
"ষ",
"উ",
"ঠ",
"ূ",
"॥",
"ঘ",
"?",
".",
"ফ",
"ৃ",
"ঙ",
"ৌ",
"ড",
"ং",
"ঞ",
";",
"!",
"১",
"ঢ়",
"ঢ",
"ড়",
"ৎ",
"ঃ",
"২",
"৩",
"৪",
"‌",
"৭",
"৬",
"়",
"৫",
"৯",
"৮",
"০",
"ঈ",
"ঝ",
"ঐ",
"e",
"(",
"ঋ",
"r",
")",
"৷",
"n",
"i",
"ঔ",
"o",
"a",
"t",
"s",
"h",
"g",
"*",
"l",
"m",
"ঊ",
"u",
"f",
"y",
"c",
"b",
"d",
" ",
"v",
"w",
"A",
"D",
"K",
":",
"W",
"p",
"I",
"B",
"M",
"j",
"k",
"q",
"x",
"z",
"C",
"E",
"F",
"G",
"H",
"J",
"L",
"N",
"O",
"P",
"Q",
"R",
"S",
"T",
"U",
"V",
"X",
"Y",
"Z",
"0",
"1",
"2",
"3",
"4",
"5",
"6",
"7",
"8",
"9",
"०",
"१",
"२",
"३",
"४",
"५",
"६",
"७",
"८",
"९",
"[",
"]",
"{",
"}",
"/",
"@",
"#",
"$",
"%",
"&",
"+",
"=",
"<",
">",
"|",
"\\",
"`",
"~"
]