Persian_OCR / vocab.json
farbodpya's picture
Upload folder using huggingface_hub
87b1acf verified
{
"char_to_idx": {
" ": 1,
"!": 2,
"#": 3,
"%": 4,
"&": 5,
"(": 6,
")": 7,
"*": 8,
"+": 9,
",": 10,
"-": 11,
".": 12,
"/": 13,
":": 14,
"=": 15,
"?": 16,
"A": 17,
"B": 18,
"C": 19,
"D": 20,
"E": 21,
"F": 22,
"G": 23,
"H": 24,
"I": 25,
"J": 26,
"K": 27,
"L": 28,
"M": 29,
"N": 30,
"O": 31,
"P": 32,
"Q": 33,
"R": 34,
"S": 35,
"T": 36,
"U": 37,
"V": 38,
"W": 39,
"X": 40,
"Y": 41,
"Z": 42,
"[": 43,
"\\": 44,
"]": 45,
"a": 46,
"b": 47,
"c": 48,
"d": 49,
"e": 50,
"f": 51,
"g": 52,
"h": 53,
"i": 54,
"j": 55,
"k": 56,
"l": 57,
"m": 58,
"n": 59,
"o": 60,
"p": 61,
"r": 62,
"s": 63,
"t": 64,
"u": 65,
"v": 66,
"w": 67,
"x": 68,
"y": 69,
"z": 70,
"|": 71,
"«": 72,
"»": 73,
"¾": 74,
"Â": 75,
"ğ": 76,
"ı": 77,
"Σ": 78,
"π": 79,
"ω": 80,
"،": 81,
"؛": 82,
"؟": 83,
"ء": 84,
"آ": 85,
"أ": 86,
"ؤ": 87,
"إ": 88,
"ئ": 89,
"ا": 90,
"ب": 91,
"ة": 92,
"ت": 93,
"ث": 94,
"ج": 95,
"ح": 96,
"خ": 97,
"د": 98,
"ذ": 99,
"ر": 100,
"ز": 101,
"س": 102,
"ش": 103,
"ص": 104,
"ض": 105,
"ط": 106,
"ظ": 107,
"ع": 108,
"غ": 109,
"ـ": 110,
"ف": 111,
"ق": 112,
"ك": 113,
"ل": 114,
"م": 115,
"ن": 116,
"ه": 117,
"و": 118,
"ى": 119,
"ي": 120,
"ً": 121,
"ٌ": 122,
"ٍ": 123,
"َ": 124,
"ُ": 125,
"ِ": 126,
"ّ": 127,
"ْ": 128,
"ٔ": 129,
"ٙ": 130,
"ٚ": 131,
"ٛ": 132,
"٠": 133,
"١": 134,
"٢": 135,
"٣": 136,
"٤": 137,
"٥": 138,
"٦": 139,
"٧": 140,
"٨": 141,
"٩": 142,
"٪": 143,
"٫": 144,
"٬": 145,
"ٰ": 146,
"ٱ": 147,
"ٲ": 148,
"ٴ": 149,
"ٵ": 150,
"ٸ": 151,
"ٹ": 152,
"پ": 153,
"ځ": 154,
"چ": 155,
"ڈ": 156,
"ڑ": 157,
"ڒ": 158,
"ڔ": 159,
"ڕ": 160,
"ژ": 161,
"ښ": 162,
"ڞ": 163,
"ڠ": 164,
"ڤ": 165,
"ڨ": 166,
"ک": 167,
"ګ": 168,
"ڬ": 169,
"ڭ": 170,
"گ": 171,
"ڵ": 172,
"ڶ": 173,
"ں": 174,
"ھ": 175,
"ۀ": 176,
"ہ": 177,
"ۂ": 178,
"ۃ": 179,
"ۅ": 180,
"ۆ": 181,
"ۇ": 182,
"ۉ": 183,
"ۊ": 184,
"ۋ": 185,
"ی": 186,
"ە": 187,
"ۖ": 188,
"ۗ": 189,
"ۘ": 190,
"ۚ": 191,
"۰": 192,
"۱": 193,
"۲": 194,
"۳": 195,
"۴": 196,
"۵": 197,
"۶": 198,
"۷": 199,
"۸": 200,
"۹": 201,
"ಠ": 202,
"ಥ": 203,
"ა": 204,
"დ": 205,
"ი": 206,
"ნ": 207,
"ღ": 208,
"‌": 209,
"…": 210,
"ツ": 211,
"ヽ": 212,
"天": 213,
"娜": 214,
"梦": 215,
"米": 216,
"ﭘ": 217,
"ﭼ": 218,
"ﮐ": 219,
"ﮑ": 220,
"ﮔ": 221,
"ﮫ": 222,
"ﮬ": 223,
"ﯨ": 224,
"ﯼ": 225,
"ﯽ": 226,
"ﯾ": 227,
"ﯿ": 228,
"ﷲ": 229,
"ﷻ": 230,
"ﺍ": 231,
"ﺎ": 232,
"ﺏ": 233,
"ﺐ": 234,
"ﺑ": 235,
"ﺒ": 236,
"ﺕ": 237,
"ﺖ": 238,
"ﺗ": 239,
"ﺘ": 240,
"ﺟ": 241,
"ﺠ": 242,
"ﺤ": 243,
"ﺥ": 244,
"ﺧ": 245,
"ﺨ": 246,
"ﺩ": 247,
"ﺪ": 248,
"ﺭ": 249,
"ﺮ": 250,
"ﺯ": 251,
"ﺳ": 252,
"ﺴ": 253,
"ﺷ": 254,
"ﺸ": 255,
"ﻄ": 256,
"ﻈ": 257,
"ﻉ": 258,
"ﻋ": 259,
"ﻌ": 260,
"ﻔ": 261,
"ﻖ": 262,
"ﻗ": 263,
"ﻘ": 264,
"ﻜ": 265,
"ﻝ": 266,
"ﻟ": 267,
"ﻠ": 268,
"ﻡ": 269,
"ﻢ": 270,
"ﻣ": 271,
"ﻤ": 272,
"ﻥ": 273,
"ﻦ": 274,
"ﻧ": 275,
"ﻨ": 276,
"ﻩ": 277,
"ﻪ": 278,
"ﻫ": 279,
"ﻬ": 280,
"ﻭ": 281,
"ﻮ": 282,
"ﻱ": 283,
"ﻲ": 284,
"ﻳ": 285,
"ﻴ": 286,
"ﻻ": 287
},
"idx_to_char": {
"1": " ",
"2": "!",
"3": "#",
"4": "%",
"5": "&",
"6": "(",
"7": ")",
"8": "*",
"9": "+",
"10": ",",
"11": "-",
"12": ".",
"13": "/",
"14": ":",
"15": "=",
"16": "?",
"17": "A",
"18": "B",
"19": "C",
"20": "D",
"21": "E",
"22": "F",
"23": "G",
"24": "H",
"25": "I",
"26": "J",
"27": "K",
"28": "L",
"29": "M",
"30": "N",
"31": "O",
"32": "P",
"33": "Q",
"34": "R",
"35": "S",
"36": "T",
"37": "U",
"38": "V",
"39": "W",
"40": "X",
"41": "Y",
"42": "Z",
"43": "[",
"44": "\\",
"45": "]",
"46": "a",
"47": "b",
"48": "c",
"49": "d",
"50": "e",
"51": "f",
"52": "g",
"53": "h",
"54": "i",
"55": "j",
"56": "k",
"57": "l",
"58": "m",
"59": "n",
"60": "o",
"61": "p",
"62": "r",
"63": "s",
"64": "t",
"65": "u",
"66": "v",
"67": "w",
"68": "x",
"69": "y",
"70": "z",
"71": "|",
"72": "«",
"73": "»",
"74": "¾",
"75": "Â",
"76": "ğ",
"77": "ı",
"78": "Σ",
"79": "π",
"80": "ω",
"81": "،",
"82": "؛",
"83": "؟",
"84": "ء",
"85": "آ",
"86": "أ",
"87": "ؤ",
"88": "إ",
"89": "ئ",
"90": "ا",
"91": "ب",
"92": "ة",
"93": "ت",
"94": "ث",
"95": "ج",
"96": "ح",
"97": "خ",
"98": "د",
"99": "ذ",
"100": "ر",
"101": "ز",
"102": "س",
"103": "ش",
"104": "ص",
"105": "ض",
"106": "ط",
"107": "ظ",
"108": "ع",
"109": "غ",
"110": "ـ",
"111": "ف",
"112": "ق",
"113": "ك",
"114": "ل",
"115": "م",
"116": "ن",
"117": "ه",
"118": "و",
"119": "ى",
"120": "ي",
"121": "ً",
"122": "ٌ",
"123": "ٍ",
"124": "َ",
"125": "ُ",
"126": "ِ",
"127": "ّ",
"128": "ْ",
"129": "ٔ",
"130": "ٙ",
"131": "ٚ",
"132": "ٛ",
"133": "٠",
"134": "١",
"135": "٢",
"136": "٣",
"137": "٤",
"138": "٥",
"139": "٦",
"140": "٧",
"141": "٨",
"142": "٩",
"143": "٪",
"144": "٫",
"145": "٬",
"146": "ٰ",
"147": "ٱ",
"148": "ٲ",
"149": "ٴ",
"150": "ٵ",
"151": "ٸ",
"152": "ٹ",
"153": "پ",
"154": "ځ",
"155": "چ",
"156": "ڈ",
"157": "ڑ",
"158": "ڒ",
"159": "ڔ",
"160": "ڕ",
"161": "ژ",
"162": "ښ",
"163": "ڞ",
"164": "ڠ",
"165": "ڤ",
"166": "ڨ",
"167": "ک",
"168": "ګ",
"169": "ڬ",
"170": "ڭ",
"171": "گ",
"172": "ڵ",
"173": "ڶ",
"174": "ں",
"175": "ھ",
"176": "ۀ",
"177": "ہ",
"178": "ۂ",
"179": "ۃ",
"180": "ۅ",
"181": "ۆ",
"182": "ۇ",
"183": "ۉ",
"184": "ۊ",
"185": "ۋ",
"186": "ی",
"187": "ە",
"188": "ۖ",
"189": "ۗ",
"190": "ۘ",
"191": "ۚ",
"192": "۰",
"193": "۱",
"194": "۲",
"195": "۳",
"196": "۴",
"197": "۵",
"198": "۶",
"199": "۷",
"200": "۸",
"201": "۹",
"202": "ಠ",
"203": "ಥ",
"204": "ა",
"205": "დ",
"206": "ი",
"207": "ნ",
"208": "ღ",
"209": "‌",
"210": "…",
"211": "ツ",
"212": "ヽ",
"213": "天",
"214": "娜",
"215": "梦",
"216": "米",
"217": "ﭘ",
"218": "ﭼ",
"219": "ﮐ",
"220": "ﮑ",
"221": "ﮔ",
"222": "ﮫ",
"223": "ﮬ",
"224": "ﯨ",
"225": "ﯼ",
"226": "ﯽ",
"227": "ﯾ",
"228": "ﯿ",
"229": "ﷲ",
"230": "ﷻ",
"231": "ﺍ",
"232": "ﺎ",
"233": "ﺏ",
"234": "ﺐ",
"235": "ﺑ",
"236": "ﺒ",
"237": "ﺕ",
"238": "ﺖ",
"239": "ﺗ",
"240": "ﺘ",
"241": "ﺟ",
"242": "ﺠ",
"243": "ﺤ",
"244": "ﺥ",
"245": "ﺧ",
"246": "ﺨ",
"247": "ﺩ",
"248": "ﺪ",
"249": "ﺭ",
"250": "ﺮ",
"251": "ﺯ",
"252": "ﺳ",
"253": "ﺴ",
"254": "ﺷ",
"255": "ﺸ",
"256": "ﻄ",
"257": "ﻈ",
"258": "ﻉ",
"259": "ﻋ",
"260": "ﻌ",
"261": "ﻔ",
"262": "ﻖ",
"263": "ﻗ",
"264": "ﻘ",
"265": "ﻜ",
"266": "ﻝ",
"267": "ﻟ",
"268": "ﻠ",
"269": "ﻡ",
"270": "ﻢ",
"271": "ﻣ",
"272": "ﻤ",
"273": "ﻥ",
"274": "ﻦ",
"275": "ﻧ",
"276": "ﻨ",
"277": "ﻩ",
"278": "ﻪ",
"279": "ﻫ",
"280": "ﻬ",
"281": "ﻭ",
"282": "ﻮ",
"283": "ﻱ",
"284": "ﻲ",
"285": "ﻳ",
"286": "ﻴ",
"287": "ﻻ"
}
}