{ "hyperparameters": { "data_file": "/home/metythorn/data/metythorn/konai/services/ocr-service/data/processed/text-recognition/ocr_dataset_v5.txt", "img_height": 128, "patch_size": 16, "dim_feedforward": 3072, "dropout": 0.1, "augment": false, "max_decode_len": 289, "quiet": false, "cer_samples": 512, "device": "cuda:1", "seed": 42, "val_ratio": 0.05, "num_workers": 4, "pin_memory": true, "grad_clip": 1.0, "weight_decay": 0.01, "label_smoothing": 0.05, "use_amp": true, "lr_warmup_ratio": 0.1, "min_lr_ratio": 0.1, "early_stopping_patience": 5, "img_width": 384, "batch_size": 90, "lr": 8e-05, "epochs": 8, "d_model": 768, "nhead": 12, "num_layers": 10, "checkpoint_dir": "logs/ViTOCR_base_khmerid_v1", "model_size": "base", "config_path": "logs/ViTOCR_base_khmerid_v1/config.json" }, "vocab": { "specials": [ "", "", "" ], "char2idx": { "": 0, "": 1, "": 2, "\u0006": 3, " ": 4, "!": 5, "\"": 6, "#": 7, "$": 8, "%": 9, "&": 10, "'": 11, "(": 12, ")": 13, "*": 14, "+": 15, ",": 16, "-": 17, ".": 18, "/": 19, "0": 20, "1": 21, "2": 22, "3": 23, "4": 24, "5": 25, "6": 26, "7": 27, "8": 28, "9": 29, ":": 30, ";": 31, "<": 32, "=": 33, ">": 34, "?": 35, "@": 36, "A": 37, "B": 38, "C": 39, "D": 40, "E": 41, "F": 42, "G": 43, "H": 44, "I": 45, "J": 46, "K": 47, "L": 48, "M": 49, "N": 50, "O": 51, "P": 52, "Q": 53, "R": 54, "S": 55, "T": 56, "U": 57, "V": 58, "W": 59, "X": 60, "Y": 61, "Z": 62, "[": 63, "\\": 64, "]": 65, "^": 66, "_": 67, "`": 68, "a": 69, "b": 70, "c": 71, "d": 72, "e": 73, "f": 74, "g": 75, "h": 76, "i": 77, "j": 78, "k": 79, "l": 80, "m": 81, "n": 82, "o": 83, "p": 84, "q": 85, "r": 86, "s": 87, "t": 88, "u": 89, "v": 90, "w": 91, "x": 92, "y": 93, "z": 94, "{": 95, "|": 96, "}": 97, "~": 98, "¡": 99, "¢": 100, "£": 101, "¤": 102, "¥": 103, "¦": 104, "§": 105, "¨": 106, "©": 107, "ª": 108, "«": 109, "¬": 110, "­": 111, "®": 112, "°": 113, "±": 114, "²": 115, "³": 116, "´": 117, "µ": 118, "¶": 119, "·": 120, "¹": 121, "»": 122, "¼": 123, "½": 124, "¿": 125, "À": 126, "Á": 127, "Â": 128, "Ã": 129, "Ä": 130, "Å": 131, "Æ": 132, "Ç": 133, "È": 134, "É": 135, "Ê": 136, "Ë": 137, "Ì": 138, "Í": 139, "Î": 140, "Ï": 141, "Ð": 142, "Ñ": 143, "Ò": 144, "Ó": 145, "Ô": 146, "Ö": 147, "×": 148, "Ø": 149, "Ù": 150, "Ú": 151, "Ü": 152, "Þ": 153, "ß": 154, "à": 155, "á": 156, "â": 157, "ã": 158, "ä": 159, "å": 160, "æ": 161, "ç": 162, "è": 163, "é": 164, "ê": 165, "ë": 166, "ì": 167, "í": 168, "î": 169, "ï": 170, "ð": 171, "ñ": 172, "ò": 173, "ó": 174, "ô": 175, "õ": 176, "ö": 177, "÷": 178, "ø": 179, "ù": 180, "ú": 181, "û": 182, "ü": 183, "ý": 184, "þ": 185, "Ā": 186, "ā": 187, "Ă": 188, "ă": 189, "ą": 190, "ć": 191, "Č": 192, "č": 193, "Đ": 194, "đ": 195, "Ē": 196, "ē": 197, "Ĕ": 198, "ĕ": 199, "ė": 200, "ę": 201, "ě": 202, "Ğ": 203, "ğ": 204, "ĩ": 205, "Ī": 206, "ī": 207, "Ĭ": 208, "ĭ": 209, "İ": 210, "ı": 211, "Ľ": 212, "Ł": 213, "ł": 214, "ń": 215, "ņ": 216, "Ŋ": 217, "ŋ": 218, "Ō": 219, "ō": 220, "ŏ": 221, "Œ": 222, "œ": 223, "Ś": 224, "ś": 225, "Ş": 226, "ş": 227, "Š": 228, "š": 229, "ţ": 230, "Ũ": 231, "ũ": 232, "Ū": 233, "ū": 234, "Ŭ": 235, "ŭ": 236, "ů": 237, "ź": 238, "Ż": 239, "ż": 240, "Ž": 241, "ž": 242, "Ɔ": 243, "Ə": 244, "ƒ": 245, "Ɨ": 246, "Ơ": 247, "ơ": 248, "Ư": 249, "ư": 250, "Ʊ": 251, "Ʒ": 252, "ǎ": 253, "ǐ": 254, "ǒ": 255, "ǣ": 256, "ȳ": 257, "ɐ": 258, "ɑ": 259, "ɔ": 260, "ɕ": 261, "ɗ": 262, "ə": 263, "ɛ": 264, "ɡ": 265, "ɦ": 266, "ɨ": 267, "ɪ": 268, "ɬ": 269, "ɯ": 270, "ɲ": 271, "ɽ": 272, "ʄ": 273, "ʊ": 274, "ʍ": 275, "ʒ": 276, "ʔ": 277, "ʰ": 278, "ˈ": 279, "ː": 280, "̀": 281, "́": 282, "̄": 283, "̆": 284, "̋": 285, "̐": 286, "̥": 287, "̰": 288, "̲": 289, "͡": 290, "Ί": 291, "Α": 292, "Δ": 293, "Θ": 294, "Ι": 295, "Λ": 296, "Ο": 297, "Π": 298, "Σ": 299, "Τ": 300, "Υ": 301, "Ω": 302, "ί": 303, "α": 304, "β": 305, "γ": 306, "δ": 307, "ε": 308, "θ": 309, "ι": 310, "κ": 311, "λ": 312, "μ": 313, "ν": 314, "ξ": 315, "ο": 316, "π": 317, "ρ": 318, "ς": 319, "σ": 320, "τ": 321, "υ": 322, "φ": 323, "χ": 324, "ό": 325, "А": 326, "Б": 327, "В": 328, "Г": 329, "Д": 330, "Е": 331, "З": 332, "И": 333, "К": 334, "Л": 335, "М": 336, "Н": 337, "О": 338, "П": 339, "Р": 340, "С": 341, "Т": 342, "У": 343, "Ф": 344, "Ц": 345, "Ы": 346, "Ь": 347, "Э": 348, "а": 349, "б": 350, "в": 351, "г": 352, "д": 353, "е": 354, "ж": 355, "з": 356, "и": 357, "й": 358, "к": 359, "л": 360, "м": 361, "н": 362, "о": 363, "п": 364, "р": 365, "с": 366, "т": 367, "у": 368, "ф": 369, "х": 370, "ц": 371, "ч": 372, "ш": 373, "щ": 374, "ъ": 375, "ы": 376, "ь": 377, "э": 378, "ю": 379, "я": 380, "ё": 381, "ѕ": 382, "і": 383, "ї": 384, "ј": 385, "ѹ": 386, "ү": 387, "ԁ": 388, "آ": 389, "ا": 390, "ب": 391, "ت": 392, "ر": 393, "ز": 394, "س": 395, "غ": 396, "ل": 397, "م": 398, "ن": 399, "ه": 400, "و": 401, "پ": 402, "ک": 403, "ی": 404, "۵": 405, "़": 406, "ટ": 407, "સ": 408, "ે": 409, "્": 410, "ิ": 411, "ฺ": 412, "้": 413, "๋": 414, "ါ": 415, "ာ": 416, "ေ": 417, "ွ": 418, "ក": 419, "ខ": 420, "គ": 421, "ឃ": 422, "ង": 423, "ច": 424, "ឆ": 425, "ជ": 426, "ឈ": 427, "ញ": 428, "ដ": 429, "ឋ": 430, "ឌ": 431, "ឍ": 432, "ណ": 433, "ត": 434, "ថ": 435, "ទ": 436, "ធ": 437, "ន": 438, "ប": 439, "ផ": 440, "ព": 441, "ភ": 442, "ម": 443, "យ": 444, "រ": 445, "ល": 446, "វ": 447, "ឝ": 448, "ឞ": 449, "ស": 450, "ហ": 451, "ឡ": 452, "អ": 453, "ឣ": 454, "ឤ": 455, "ឥ": 456, "ឦ": 457, "ឧ": 458, "ឨ": 459, "ឩ": 460, "ឪ": 461, "ឫ": 462, "ឬ": 463, "ឭ": 464, "ឮ": 465, "ឯ": 466, "ឰ": 467, "ឱ": 468, "ឲ": 469, "ឳ": 470, "឵": 471, "ា": 472, "ិ": 473, "ី": 474, "ឹ": 475, "ឺ": 476, "ុ": 477, "ូ": 478, "ួ": 479, "ើ": 480, "ឿ": 481, "ៀ": 482, "េ": 483, "ែ": 484, "ៃ": 485, "ោ": 486, "ៅ": 487, "ំ": 488, "ះ": 489, "ៈ": 490, "៉": 491, "៊": 492, "់": 493, "៌": 494, "៍": 495, "៎": 496, "៏": 497, "័": 498, "៑": 499, "្": 500, "៓": 501, "។": 502, "៕": 503, "៖": 504, "ៗ": 505, "៘": 506, "៙": 507, "៚": 508, "៛": 509, "៝": 510, "០": 511, "១": 512, "២": 513, "៣": 514, "៤": 515, "៥": 516, "៦": 517, "៧": 518, "៨": 519, "៩": 520, "៰": 521, "៱": 522, "៲": 523, "៸": 524, "៹": 525, "᧥": 526, "᧦": 527, "᧯": 528, "᧰": 529, "ḍ": 530, "ḓ": 531, "ḛ": 532, "ḥ": 533, "Ḳ": 534, "ḷ": 535, "ṁ": 536, "Ṃ": 537, "ṃ": 538, "Ṅ": 539, "ṅ": 540, "Ṇ": 541, "ṇ": 542, "ṛ": 543, "Ṣ": 544, "ṣ": 545, "Ṭ": 546, "ṭ": 547, "Ạ": 548, "ạ": 549, "Ả": 550, "ả": 551, "Ấ": 552, "ấ": 553, "Ầ": 554, "ầ": 555, "ẩ": 556, "Ậ": 557, "ậ": 558, "ắ": 559, "ẳ": 560, "ặ": 561, "Ẹ": 562, "ẹ": 563, "ẻ": 564, "ế": 565, "Ề": 566, "ề": 567, "Ể": 568, "ể": 569, "ễ": 570, "ệ": 571, "Ỉ": 572, "ỉ": 573, "Ị": 574, "ị": 575, "Ọ": 576, "ọ": 577, "ỏ": 578, "ố": 579, "ồ": 580, "ổ": 581, "ỗ": 582, "Ộ": 583, "ộ": 584, "Ớ": 585, "ớ": 586, "Ờ": 587, "ờ": 588, "ợ": 589, "ụ": 590, "Ủ": 591, "ủ": 592, "Ứ": 593, "ứ": 594, "ừ": 595, "ử": 596, "Ữ": 597, "ữ": 598, "ự": 599, "ỳ": 600, "ỹ": 601, "​": 602, "‌": 603, "‍": 604, "‎": 605, "‏": 606, "‐": 607, "‑": 608, "–": 609, "—": 610, "‘": 611, "’": 612, "“": 613, "”": 614, "„": 615, "†": 616, "•": 617, "…": 618, "‪": 619, "‫": 620, "‬": 621, "′": 622, "″": 623, "‹": 624, "›": 625, "⁄": 626, "⁠": 627, "⁡": 628, "⁣": 629, "€": 630, "№": 631, "™": 632, "←": 633, "↑": 634, "→": 635, "↓": 636, "−": 637, "∙": 638, "∞": 639, "∫": 640, "≈": 641, "≤": 642, "≥": 643, "⋅": 644, "▪": 645, "►": 646, "▼": 647, "▾": 648, "◌": 649, "●": 650, "⚫": 651, "✅": 652, "⟶": 653, "伍": 654, "和": 655, "德": 656, "連": 657, "郑": 658, "Ɡ": 659, "꫁": 660, "": 661, "": 662, ";": 663, "�": 664, "🎉": 665 }, "idx2char": { "0": "", "1": "", "2": "", "3": "\u0006", "4": " ", "5": "!", "6": "\"", "7": "#", "8": "$", "9": "%", "10": "&", "11": "'", "12": "(", "13": ")", "14": "*", "15": "+", "16": ",", "17": "-", "18": ".", "19": "/", "20": "0", "21": "1", "22": "2", "23": "3", "24": "4", "25": "5", "26": "6", "27": "7", "28": "8", "29": "9", "30": ":", "31": ";", "32": "<", "33": "=", "34": ">", "35": "?", "36": "@", "37": "A", "38": "B", "39": "C", "40": "D", "41": "E", "42": "F", "43": "G", "44": "H", "45": "I", "46": "J", "47": "K", "48": "L", "49": "M", "50": "N", "51": "O", "52": "P", "53": "Q", "54": "R", "55": "S", "56": "T", "57": "U", "58": "V", "59": "W", "60": "X", "61": "Y", "62": "Z", "63": "[", "64": "\\", "65": "]", "66": "^", "67": "_", "68": "`", "69": "a", "70": "b", "71": "c", "72": "d", "73": "e", "74": "f", "75": "g", "76": "h", "77": "i", "78": "j", "79": "k", "80": "l", "81": "m", "82": "n", "83": "o", "84": "p", "85": "q", "86": "r", "87": "s", "88": "t", "89": "u", "90": "v", "91": "w", "92": "x", "93": "y", "94": "z", "95": "{", "96": "|", "97": "}", "98": "~", "99": "¡", "100": "¢", "101": "£", "102": "¤", "103": "¥", "104": "¦", "105": "§", "106": "¨", "107": "©", "108": "ª", "109": "«", "110": "¬", "111": "­", "112": "®", "113": "°", "114": "±", "115": "²", "116": "³", "117": "´", "118": "µ", "119": "¶", "120": "·", "121": "¹", "122": "»", "123": "¼", "124": "½", "125": "¿", "126": "À", "127": "Á", "128": "Â", "129": "Ã", "130": "Ä", "131": "Å", "132": "Æ", "133": "Ç", "134": "È", "135": "É", "136": "Ê", "137": "Ë", "138": "Ì", "139": "Í", "140": "Î", "141": "Ï", "142": "Ð", "143": "Ñ", "144": "Ò", "145": "Ó", "146": "Ô", "147": "Ö", "148": "×", "149": "Ø", "150": "Ù", "151": "Ú", "152": "Ü", "153": "Þ", "154": "ß", "155": "à", "156": "á", "157": "â", "158": "ã", "159": "ä", "160": "å", "161": "æ", "162": "ç", "163": "è", "164": "é", "165": "ê", "166": "ë", "167": "ì", "168": "í", "169": "î", "170": "ï", "171": "ð", "172": "ñ", "173": "ò", "174": "ó", "175": "ô", "176": "õ", "177": "ö", "178": "÷", "179": "ø", "180": "ù", "181": "ú", "182": "û", "183": "ü", "184": "ý", "185": "þ", "186": "Ā", "187": "ā", "188": "Ă", "189": "ă", "190": "ą", "191": "ć", "192": "Č", "193": "č", "194": "Đ", "195": "đ", "196": "Ē", "197": "ē", "198": "Ĕ", "199": "ĕ", "200": "ė", "201": "ę", "202": "ě", "203": "Ğ", "204": "ğ", "205": "ĩ", "206": "Ī", "207": "ī", "208": "Ĭ", "209": "ĭ", "210": "İ", "211": "ı", "212": "Ľ", "213": "Ł", "214": "ł", "215": "ń", "216": "ņ", "217": "Ŋ", "218": "ŋ", "219": "Ō", "220": "ō", "221": "ŏ", "222": "Œ", "223": "œ", "224": "Ś", "225": "ś", "226": "Ş", "227": "ş", "228": "Š", "229": "š", "230": "ţ", "231": "Ũ", "232": "ũ", "233": "Ū", "234": "ū", "235": "Ŭ", "236": "ŭ", "237": "ů", "238": "ź", "239": "Ż", "240": "ż", "241": "Ž", "242": "ž", "243": "Ɔ", "244": "Ə", "245": "ƒ", "246": "Ɨ", "247": "Ơ", "248": "ơ", "249": "Ư", "250": "ư", "251": "Ʊ", "252": "Ʒ", "253": "ǎ", "254": "ǐ", "255": "ǒ", "256": "ǣ", "257": "ȳ", "258": "ɐ", "259": "ɑ", "260": "ɔ", "261": "ɕ", "262": "ɗ", "263": "ə", "264": "ɛ", "265": "ɡ", "266": "ɦ", "267": "ɨ", "268": "ɪ", "269": "ɬ", "270": "ɯ", "271": "ɲ", "272": "ɽ", "273": "ʄ", "274": "ʊ", "275": "ʍ", "276": "ʒ", "277": "ʔ", "278": "ʰ", "279": "ˈ", "280": "ː", "281": "̀", "282": "́", "283": "̄", "284": "̆", "285": "̋", "286": "̐", "287": "̥", "288": "̰", "289": "̲", "290": "͡", "291": "Ί", "292": "Α", "293": "Δ", "294": "Θ", "295": "Ι", "296": "Λ", "297": "Ο", "298": "Π", "299": "Σ", "300": "Τ", "301": "Υ", "302": "Ω", "303": "ί", "304": "α", "305": "β", "306": "γ", "307": "δ", "308": "ε", "309": "θ", "310": "ι", "311": "κ", "312": "λ", "313": "μ", "314": "ν", "315": "ξ", "316": "ο", "317": "π", "318": "ρ", "319": "ς", "320": "σ", "321": "τ", "322": "υ", "323": "φ", "324": "χ", "325": "ό", "326": "А", "327": "Б", "328": "В", "329": "Г", "330": "Д", "331": "Е", "332": "З", "333": "И", "334": "К", "335": "Л", "336": "М", "337": "Н", "338": "О", "339": "П", "340": "Р", "341": "С", "342": "Т", "343": "У", "344": "Ф", "345": "Ц", "346": "Ы", "347": "Ь", "348": "Э", "349": "а", "350": "б", "351": "в", "352": "г", "353": "д", "354": "е", "355": "ж", "356": "з", "357": "и", "358": "й", "359": "к", "360": "л", "361": "м", "362": "н", "363": "о", "364": "п", "365": "р", "366": "с", "367": "т", "368": "у", "369": "ф", "370": "х", "371": "ц", "372": "ч", "373": "ш", "374": "щ", "375": "ъ", "376": "ы", "377": "ь", "378": "э", "379": "ю", "380": "я", "381": "ё", "382": "ѕ", "383": "і", "384": "ї", "385": "ј", "386": "ѹ", "387": "ү", "388": "ԁ", "389": "آ", "390": "ا", "391": "ب", "392": "ت", "393": "ر", "394": "ز", "395": "س", "396": "غ", "397": "ل", "398": "م", "399": "ن", "400": "ه", "401": "و", "402": "پ", "403": "ک", "404": "ی", "405": "۵", "406": "़", "407": "ટ", "408": "સ", "409": "ે", "410": "્", "411": "ิ", "412": "ฺ", "413": "้", "414": "๋", "415": "ါ", "416": "ာ", "417": "ေ", "418": "ွ", "419": "ក", "420": "ខ", "421": "គ", "422": "ឃ", "423": "ង", "424": "ច", "425": "ឆ", "426": "ជ", "427": "ឈ", "428": "ញ", "429": "ដ", "430": "ឋ", "431": "ឌ", "432": "ឍ", "433": "ណ", "434": "ត", "435": "ថ", "436": "ទ", "437": "ធ", "438": "ន", "439": "ប", "440": "ផ", "441": "ព", "442": "ភ", "443": "ម", "444": "យ", "445": "រ", "446": "ល", "447": "វ", "448": "ឝ", "449": "ឞ", "450": "ស", "451": "ហ", "452": "ឡ", "453": "អ", "454": "ឣ", "455": "ឤ", "456": "ឥ", "457": "ឦ", "458": "ឧ", "459": "ឨ", "460": "ឩ", "461": "ឪ", "462": "ឫ", "463": "ឬ", "464": "ឭ", "465": "ឮ", "466": "ឯ", "467": "ឰ", "468": "ឱ", "469": "ឲ", "470": "ឳ", "471": "឵", "472": "ា", "473": "ិ", "474": "ី", "475": "ឹ", "476": "ឺ", "477": "ុ", "478": "ូ", "479": "ួ", "480": "ើ", "481": "ឿ", "482": "ៀ", "483": "េ", "484": "ែ", "485": "ៃ", "486": "ោ", "487": "ៅ", "488": "ំ", "489": "ះ", "490": "ៈ", "491": "៉", "492": "៊", "493": "់", "494": "៌", "495": "៍", "496": "៎", "497": "៏", "498": "័", "499": "៑", "500": "្", "501": "៓", "502": "។", "503": "៕", "504": "៖", "505": "ៗ", "506": "៘", "507": "៙", "508": "៚", "509": "៛", "510": "៝", "511": "០", "512": "១", "513": "២", "514": "៣", "515": "៤", "516": "៥", "517": "៦", "518": "៧", "519": "៨", "520": "៩", "521": "៰", "522": "៱", "523": "៲", "524": "៸", "525": "៹", "526": "᧥", "527": "᧦", "528": "᧯", "529": "᧰", "530": "ḍ", "531": "ḓ", "532": "ḛ", "533": "ḥ", "534": "Ḳ", "535": "ḷ", "536": "ṁ", "537": "Ṃ", "538": "ṃ", "539": "Ṅ", "540": "ṅ", "541": "Ṇ", "542": "ṇ", "543": "ṛ", "544": "Ṣ", "545": "ṣ", "546": "Ṭ", "547": "ṭ", "548": "Ạ", "549": "ạ", "550": "Ả", "551": "ả", "552": "Ấ", "553": "ấ", "554": "Ầ", "555": "ầ", "556": "ẩ", "557": "Ậ", "558": "ậ", "559": "ắ", "560": "ẳ", "561": "ặ", "562": "Ẹ", "563": "ẹ", "564": "ẻ", "565": "ế", "566": "Ề", "567": "ề", "568": "Ể", "569": "ể", "570": "ễ", "571": "ệ", "572": "Ỉ", "573": "ỉ", "574": "Ị", "575": "ị", "576": "Ọ", "577": "ọ", "578": "ỏ", "579": "ố", "580": "ồ", "581": "ổ", "582": "ỗ", "583": "Ộ", "584": "ộ", "585": "Ớ", "586": "ớ", "587": "Ờ", "588": "ờ", "589": "ợ", "590": "ụ", "591": "Ủ", "592": "ủ", "593": "Ứ", "594": "ứ", "595": "ừ", "596": "ử", "597": "Ữ", "598": "ữ", "599": "ự", "600": "ỳ", "601": "ỹ", "602": "​", "603": "‌", "604": "‍", "605": "‎", "606": "‏", "607": "‐", "608": "‑", "609": "–", "610": "—", "611": "‘", "612": "’", "613": "“", "614": "”", "615": "„", "616": "†", "617": "•", "618": "…", "619": "‪", "620": "‫", "621": "‬", "622": "′", "623": "″", "624": "‹", "625": "›", "626": "⁄", "627": "⁠", "628": "⁡", "629": "⁣", "630": "€", "631": "№", "632": "™", "633": "←", "634": "↑", "635": "→", "636": "↓", "637": "−", "638": "∙", "639": "∞", "640": "∫", "641": "≈", "642": "≤", "643": "≥", "644": "⋅", "645": "▪", "646": "►", "647": "▼", "648": "▾", "649": "◌", "650": "●", "651": "⚫", "652": "✅", "653": "⟶", "654": "伍", "655": "和", "656": "德", "657": "連", "658": "郑", "659": "Ɡ", "660": "꫁", "661": "", "662": "", "663": ";", "664": "�", "665": "🎉" } } }