File size: 974 Bytes
a22a49d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
{
"properties": {
"regex": "(\\[[^\\]]+]|Br?|Cl?|N|O|S|P|F|I|b|c|n|o|s|p|\\(|\\)|\\.|=|#|-|\\+|\\\\\\\\|\\/|:|~|@|\\?|>|\\*|\\$|\\%[0-9]{2}|[0-9]|.)",
"special_tokens": {
"start": "^",
"end": "&",
"pad": "<PAD>",
"unknown": "?",
"mask": "<MASK>",
"sep": "<SEP>"
},
"chem_start_idx": 6
},
"vocabulary": [
"<PAD>",
"?",
"^",
"&",
"<MASK>",
"<SEP>",
"O",
"=",
"C",
"1",
"N",
"(",
"/",
"c",
"2",
"n",
"[nH]",
")",
"[C@H]",
"[C@@H]",
"3",
"Br",
"F",
"S",
"Cl",
"\\",
"[N+]",
"[O-]",
"#",
"4",
"s",
"-",
"o",
"5",
"[C@@]",
"[C@]",
"6",
"P",
"7"
]
} |