File size: 974 Bytes
a22a49d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
{
    "properties": {
        "regex": "(\\[[^\\]]+]|Br?|Cl?|N|O|S|P|F|I|b|c|n|o|s|p|\\(|\\)|\\.|=|#|-|\\+|\\\\\\\\|\\/|:|~|@|\\?|>|\\*|\\$|\\%[0-9]{2}|[0-9]|.)",
        "special_tokens": {
            "start": "^",
            "end": "&",
            "pad": "<PAD>",
            "unknown": "?",
            "mask": "<MASK>",
            "sep": "<SEP>"
        },
        "chem_start_idx": 6
    },
    "vocabulary": [
        "<PAD>",
        "?",
        "^",
        "&",
        "<MASK>",
        "<SEP>",
        "O",
        "=",
        "C",
        "1",
        "N",
        "(",
        "/",
        "c",
        "2",
        "n",
        "[nH]",
        ")",
        "[C@H]",
        "[C@@H]",
        "3",
        "Br",
        "F",
        "S",
        "Cl",
        "\\",
        "[N+]",
        "[O-]",
        "#",
        "4",
        "s",
        "-",
        "o",
        "5",
        "[C@@]",
        "[C@]",
        "6",
        "P",
        "7"
    ]
}