{ "properties": { "regex": "(\\[[^\\]]+]|Br?|Cl?|N|O|S|P|F|I|b|c|n|o|s|p|\\(|\\)|\\.|=|#|-|\\+|\\\\\\\\|\\/|:|~|@|\\?|>|\\*|\\$|\\%[0-9]{2}|[0-9]|.)", "special_tokens": { "start": "^", "end": "&", "pad": "", "unknown": "?", "mask": "", "sep": "" }, "chem_start_idx": 6 }, "vocabulary": [ "", "?", "^", "&", "", "", "O", "=", "C", "1", "N", "(", "/", "c", "2", "n", "[nH]", ")", "[C@H]", "[C@@H]", "3", "Br", "F", "S", "Cl", "\\", "[N+]", "[O-]", "#", "4", "s", "-", "o", "5", "[C@@]", "[C@]", "6", "P", "7" ] }