ribesstefano commited on
Commit
0dbbcc2
·
verified ·
1 Parent(s): e4baf2e

Upload tokenizer

Browse files
Files changed (2) hide show
  1. tokenizer.json +506 -2024
  2. tokenizer_config.json +0 -1
tokenizer.json CHANGED
@@ -854,2030 +854,512 @@
854
  "OCCOCCOCCOCCO": 766
855
  },
856
  "merges": [
857
- [
858
- "c",
859
- "c"
860
- ],
861
- [
862
- "C",
863
- "C"
864
- ],
865
- [
866
- "(",
867
- "="
868
- ],
869
- [
870
- "cc",
871
- "c"
872
- ],
873
- [
874
- "]",
875
- "("
876
- ],
877
- [
878
- "@",
879
- "@"
880
- ],
881
- [
882
- "C",
883
- "c"
884
- ],
885
- [
886
- "N",
887
- "C"
888
- ],
889
- [
890
- "cc",
891
- "ccc"
892
- ],
893
- [
894
- "n",
895
- "c"
896
- ],
897
- [
898
- "CC",
899
- "C"
900
- ],
901
- [
902
- ")",
903
- "["
904
- ],
905
- [
906
- "N",
907
- "H"
908
- ],
909
- [
910
- "+",
911
- "]"
912
- ],
913
- [
914
- "C",
915
- "O"
916
- ],
917
- [
918
- "cc",
919
- "cc"
920
- ],
921
- [
922
- "N",
923
- "c"
924
- ],
925
- [
926
- "C",
927
- "l"
928
- ],
929
- [
930
- "O",
931
- "C"
932
- ],
933
- [
934
- "CC",
935
- "N"
936
- ],
937
- [
938
- ")",
939
- "("
940
- ],
941
- [
942
- "CO",
943
- "c"
944
- ],
945
- [
946
- "(",
947
- "-"
948
- ],
949
- [
950
- "(",
951
- "["
952
- ],
953
- [
954
- "CC",
955
- "CC"
956
- ],
957
- [
958
- "C",
959
- "N"
960
- ],
961
- [
962
- ")",
963
- "(="
964
- ],
965
- [
966
- "-",
967
- "]"
968
- ],
969
- [
970
- "CC",
971
- "O"
972
- ],
973
- [
974
- "n",
975
- "H"
976
- ],
977
- [
978
- "n",
979
- "n"
980
- ],
981
- [
982
- "-]",
983
- ")"
984
- ],
985
- [
986
- "+",
987
- "]("
988
- ],
989
- [
990
- "CC",
991
- "c"
992
- ],
993
- [
994
- ")",
995
- "="
996
- ],
997
- [
998
- "s",
999
- "c"
1000
- ],
1001
- [
1002
- "C",
1003
- "S"
1004
- ],
1005
- [
1006
- "n",
1007
- "cc"
1008
- ],
1009
- [
1010
- "B",
1011
- "r"
1012
- ],
1013
- [
1014
- "C",
1015
- "NC"
1016
- ],
1017
- [
1018
- "n",
1019
- "nc"
1020
- ],
1021
- [
1022
- "N",
1023
- "Cc"
1024
- ],
1025
- [
1026
- "o",
1027
- "c"
1028
- ],
1029
- [
1030
- "1",
1031
- "2"
1032
- ],
1033
- [
1034
- "CC",
1035
- "CCC"
1036
- ],
1037
- [
1038
- "+]",
1039
- "(="
1040
- ],
1041
- [
1042
- "CO",
1043
- "C"
1044
- ],
1045
- [
1046
- "C",
1047
- "n"
1048
- ],
1049
- [
1050
- "2",
1051
- "1"
1052
- ],
1053
- [
1054
- "CCC",
1055
- "N"
1056
- ],
1057
- [
1058
- "c",
1059
- "n"
1060
- ],
1061
- [
1062
- "O",
1063
- "c"
1064
- ],
1065
- [
1066
- "CC",
1067
- "OC"
1068
- ],
1069
- [
1070
- "+]",
1071
- "["
1072
- ],
1073
- [
1074
- "CCO",
1075
- "CC"
1076
- ],
1077
- [
1078
- "c",
1079
- "nc"
1080
- ],
1081
- [
1082
- "CC",
1083
- "S"
1084
- ],
1085
- [
1086
- "](",
1087
- "["
1088
- ],
1089
- [
1090
- "CCO",
1091
- "c"
1092
- ],
1093
- [
1094
- "ccc",
1095
- "s"
1096
- ],
1097
- [
1098
- "ccc",
1099
- "nc"
1100
- ],
1101
- [
1102
- "N",
1103
- "CC"
1104
- ],
1105
- [
1106
- "O",
1107
- "CC"
1108
- ],
1109
- [
1110
- "(",
1111
- "/"
1112
- ],
1113
- [
1114
- "CCC",
1115
- "O"
1116
- ],
1117
- [
1118
- "@",
1119
- "]"
1120
- ],
1121
- [
1122
- "CS",
1123
- "c"
1124
- ],
1125
- [
1126
- "ccc",
1127
- "o"
1128
- ],
1129
- [
1130
- "@@",
1131
- "]"
1132
- ],
1133
- [
1134
- "c",
1135
- "nn"
1136
- ],
1137
- [
1138
- "CC",
1139
- "n"
1140
- ],
1141
- [
1142
- "CC",
1143
- "NC"
1144
- ],
1145
- [
1146
- "3",
1147
- "2"
1148
- ],
1149
- [
1150
- "cccc",
1151
- "n"
1152
- ],
1153
- [
1154
- "2",
1155
- "3"
1156
- ],
1157
- [
1158
- "n",
1159
- "o"
1160
- ],
1161
- [
1162
- "+]",
1163
- ")"
1164
- ],
1165
- [
1166
- "n",
1167
- "oc"
1168
- ],
1169
- [
1170
- ")",
1171
- "/"
1172
- ],
1173
- [
1174
- "c",
1175
- "sc"
1176
- ],
1177
- [
1178
- "c",
1179
- "s"
1180
- ],
1181
- [
1182
- "cc",
1183
- "ncc"
1184
- ],
1185
- [
1186
- "ccc",
1187
- "n"
1188
- ],
1189
- [
1190
- "CC",
1191
- "Cc"
1192
- ],
1193
- [
1194
- "S",
1195
- "c"
1196
- ],
1197
- [
1198
- "S",
1199
- "CC"
1200
- ],
1201
- [
1202
- "cc",
1203
- "nc"
1204
- ],
1205
- [
1206
- "S",
1207
- "C"
1208
- ],
1209
- [
1210
- "O",
1211
- "Cc"
1212
- ],
1213
- [
1214
- "cc",
1215
- "sc"
1216
- ],
1217
- [
1218
- "cc",
1219
- "n"
1220
- ],
1221
- [
1222
- "N",
1223
- "NC"
1224
- ],
1225
- [
1226
- "O",
1227
- "CO"
1228
- ],
1229
- [
1230
- "@",
1231
- "]("
1232
- ],
1233
- [
1234
- "nc",
1235
- "nc"
1236
- ],
1237
- [
1238
- "N",
1239
- "S"
1240
- ],
1241
- [
1242
- "N",
1243
- "CCc"
1244
- ],
1245
- [
1246
- "@@",
1247
- "]("
1248
- ],
1249
- [
1250
- "C",
1251
- "Nc"
1252
- ],
1253
- [
1254
- "O",
1255
- "CCO"
1256
- ],
1257
- [
1258
- "=",
1259
- "["
1260
- ],
1261
- [
1262
- "n",
1263
- "cccc"
1264
- ],
1265
- [
1266
- "c",
1267
- "ncc"
1268
- ],
1269
- [
1270
- "N",
1271
- "N"
1272
- ],
1273
- [
1274
- "CCCC",
1275
- "CC"
1276
- ],
1277
- [
1278
- "N",
1279
- "CCC"
1280
- ],
1281
- [
1282
- "o",
1283
- "n"
1284
- ],
1285
- [
1286
- "+](",
1287
- "["
1288
- ],
1289
- [
1290
- "CC",
1291
- "CCN"
1292
- ],
1293
- [
1294
- "CCC",
1295
- "NC"
1296
- ],
1297
- [
1298
- "nc",
1299
- "n"
1300
- ],
1301
- [
1302
- "-]",
1303
- ")["
1304
- ],
1305
- [
1306
- "ncc",
1307
- "s"
1308
- ],
1309
- [
1310
- "+]",
1311
- "="
1312
- ],
1313
- [
1314
- "CS",
1315
- "C"
1316
- ],
1317
- [
1318
- "CCC",
1319
- "n"
1320
- ],
1321
- [
1322
- "s",
1323
- "ccc"
1324
- ],
1325
- [
1326
- "S",
1327
- "Cc"
1328
- ],
1329
- [
1330
- "CCS",
1331
- "c"
1332
- ],
1333
- [
1334
- "cnc",
1335
- "n"
1336
- ],
1337
- [
1338
- "(",
1339
- "\\"
1340
- ],
1341
- [
1342
- "CO",
1343
- "CC"
1344
- ],
1345
- [
1346
- "3",
1347
- "4"
1348
- ],
1349
- [
1350
- "nn",
1351
- "nn"
1352
- ],
1353
- [
1354
- "n",
1355
- "ccc"
1356
- ],
1357
- [
1358
- "CO",
1359
- "Cc"
1360
- ],
1361
- [
1362
- "cc",
1363
- "oc"
1364
- ],
1365
- [
1366
- ")(",
1367
- "["
1368
- ],
1369
- [
1370
- "ncc",
1371
- "n"
1372
- ],
1373
- [
1374
- "CCC",
1375
- "Oc"
1376
- ],
1377
- [
1378
- "n",
1379
- "cccn"
1380
- ],
1381
- [
1382
- "cc",
1383
- "nn"
1384
- ],
1385
- [
1386
- "CN",
1387
- "S"
1388
- ],
1389
- [
1390
- "@@]",
1391
- "(="
1392
- ],
1393
- [
1394
- "CCS",
1395
- "C"
1396
- ],
1397
- [
1398
- "4",
1399
- "3"
1400
- ],
1401
- [
1402
- "CO",
1403
- "CCN"
1404
- ],
1405
- [
1406
- "F",
1407
- "c"
1408
- ],
1409
- [
1410
- "CCS",
1411
- "CC"
1412
- ],
1413
- [
1414
- "CCC",
1415
- "S"
1416
- ],
1417
- [
1418
- "cncc",
1419
- "n"
1420
- ],
1421
- [
1422
- "-])",
1423
- "="
1424
- ],
1425
- [
1426
- "/",
1427
- "["
1428
- ],
1429
- [
1430
- "@]",
1431
- "(="
1432
- ],
1433
- [
1434
- "c",
1435
- "oc"
1436
- ],
1437
- [
1438
- "c",
1439
- "nnc"
1440
- ],
1441
- [
1442
- "CS",
1443
- "CC"
1444
- ],
1445
- [
1446
- "nn",
1447
- "n"
1448
- ],
1449
- [
1450
- "N",
1451
- "Nc"
1452
- ],
1453
- [
1454
- "nn",
1455
- "nc"
1456
- ],
1457
- [
1458
- "N",
1459
- "CCN"
1460
- ],
1461
- [
1462
- "nnc",
1463
- "n"
1464
- ],
1465
- [
1466
- "+]",
1467
- ")["
1468
- ],
1469
- [
1470
- "CCCC",
1471
- "O"
1472
- ],
1473
- [
1474
- "nc",
1475
- "nn"
1476
- ],
1477
- [
1478
- "CC",
1479
- "l"
1480
- ],
1481
- [
1482
- "CC",
1483
- "Nc"
1484
- ],
1485
- [
1486
- "Cl",
1487
- "c"
1488
- ],
1489
- [
1490
- "CS",
1491
- "Cc"
1492
- ],
1493
- [
1494
- "O",
1495
- "CCCO"
1496
- ],
1497
- [
1498
- "cnn",
1499
- "n"
1500
- ],
1501
- [
1502
- "NCC",
1503
- "NC"
1504
- ],
1505
- [
1506
- "o",
1507
- "ccc"
1508
- ],
1509
- [
1510
- "o",
1511
- "nc"
1512
- ],
1513
- [
1514
- "CCN",
1515
- "S"
1516
- ],
1517
- [
1518
- "O",
1519
- "CCC"
1520
- ],
1521
- [
1522
- ")=",
1523
- "["
1524
- ],
1525
- [
1526
- "CCC",
1527
- "OC"
1528
- ],
1529
- [
1530
- "CCCC",
1531
- "NC"
1532
- ],
1533
- [
1534
- "CO",
1535
- "CCn"
1536
- ],
1537
- [
1538
- "ncc",
1539
- "nc"
1540
- ],
1541
- [
1542
- "F",
1543
- "C"
1544
- ],
1545
- [
1546
- "CCCC",
1547
- "CCC"
1548
- ],
1549
- [
1550
- "cs",
1551
- "cc"
1552
- ],
1553
- [
1554
- "1",
1555
- "3"
1556
- ],
1557
- [
1558
- "N",
1559
- "O"
1560
- ],
1561
- [
1562
- "cn",
1563
- "ccc"
1564
- ],
1565
- [
1566
- "(\\",
1567
- "["
1568
- ],
1569
- [
1570
- "O",
1571
- "CCN"
1572
- ],
1573
- [
1574
- "n",
1575
- "s"
1576
- ],
1577
- [
1578
- "n",
1579
- "sc"
1580
- ],
1581
- [
1582
- "CO",
1583
- "CCNC"
1584
- ],
1585
- [
1586
- "N",
1587
- "CCOc"
1588
- ],
1589
- [
1590
- "CCCC",
1591
- "n"
1592
- ],
1593
- [
1594
- "csc",
1595
- "n"
1596
- ],
1597
- [
1598
- "NCC",
1599
- "n"
1600
- ],
1601
- [
1602
- "NCCC",
1603
- "n"
1604
- ],
1605
- [
1606
- "+]",
1607
- ")("
1608
- ],
1609
- [
1610
- "NCC",
1611
- "Cc"
1612
- ],
1613
- [
1614
- "CCCC",
1615
- "c"
1616
- ],
1617
- [
1618
- "cc",
1619
- "on"
1620
- ],
1621
- [
1622
- "sc",
1623
- "nc"
1624
- ],
1625
- [
1626
- "CCC",
1627
- "Nc"
1628
- ],
1629
- [
1630
- "nc",
1631
- "sc"
1632
- ],
1633
- [
1634
- "N",
1635
- "n"
1636
- ],
1637
- [
1638
- "N",
1639
- "CCCN"
1640
- ],
1641
- [
1642
- "no",
1643
- "nc"
1644
- ],
1645
- [
1646
- "Br",
1647
- "c"
1648
- ],
1649
- [
1650
- "N",
1651
- "CCS"
1652
- ],
1653
- [
1654
- "S",
1655
- "CCC"
1656
- ],
1657
- [
1658
- "CO",
1659
- "CCO"
1660
- ],
1661
- [
1662
- "nnc",
1663
- "s"
1664
- ],
1665
- [
1666
- "CN",
1667
- "Cc"
1668
- ],
1669
- [
1670
- "s",
1671
- "cc"
1672
- ],
1673
- [
1674
- "s",
1675
- "ccn"
1676
- ],
1677
- [
1678
- "N",
1679
- "CCCC"
1680
- ],
1681
- [
1682
- "(=",
1683
- "["
1684
- ],
1685
- [
1686
- "CO",
1687
- "CCOc"
1688
- ],
1689
- [
1690
- "3",
1691
- "1"
1692
- ],
1693
- [
1694
- "oc",
1695
- "nc"
1696
- ],
1697
- [
1698
- "ns",
1699
- "nc"
1700
- ],
1701
- [
1702
- "O",
1703
- "CCc"
1704
- ],
1705
- [
1706
- "CCO",
1707
- "Cc"
1708
- ],
1709
- [
1710
- "O",
1711
- "S"
1712
- ],
1713
- [
1714
- "nc",
1715
- "oc"
1716
- ],
1717
- [
1718
- "cnc",
1719
- "nc"
1720
- ],
1721
- [
1722
- "CO",
1723
- "CCC"
1724
- ],
1725
- [
1726
- "NCC",
1727
- "Nc"
1728
- ],
1729
- [
1730
- "CCC",
1731
- "l"
1732
- ],
1733
- [
1734
- "nn",
1735
- "sc"
1736
- ],
1737
- [
1738
- "CS",
1739
- "CCS"
1740
- ],
1741
- [
1742
- "CO",
1743
- "CCCNC"
1744
- ],
1745
- [
1746
- "S",
1747
- "CCc"
1748
- ],
1749
- [
1750
- "c",
1751
- "o"
1752
- ],
1753
- [
1754
- "CCCC",
1755
- "S"
1756
- ],
1757
- [
1758
- "OCC",
1759
- "NC"
1760
- ],
1761
- [
1762
- "N",
1763
- "CCO"
1764
- ],
1765
- [
1766
- "CCC",
1767
- "Sc"
1768
- ],
1769
- [
1770
- "+]",
1771
- "\\"
1772
- ],
1773
- [
1774
- "-])",
1775
- "/"
1776
- ],
1777
- [
1778
- "CS",
1779
- "CN"
1780
- ],
1781
- [
1782
- "CCCC",
1783
- "Oc"
1784
- ],
1785
- [
1786
- "\\",
1787
- "["
1788
- ],
1789
- [
1790
- "CCCCC",
1791
- "N"
1792
- ],
1793
- [
1794
- "CO",
1795
- "CCCN"
1796
- ],
1797
- [
1798
- "CS",
1799
- "CCO"
1800
- ],
1801
- [
1802
- ")",
1803
- "-"
1804
- ],
1805
- [
1806
- "O",
1807
- "CCOc"
1808
- ],
1809
- [
1810
- "ccc",
1811
- "nn"
1812
- ],
1813
- [
1814
- "CO",
1815
- "N"
1816
- ],
1817
- [
1818
- "CCO",
1819
- "CCN"
1820
- ],
1821
- [
1822
- "N",
1823
- "CCCO"
1824
- ],
1825
- [
1826
- "S",
1827
- "CCN"
1828
- ],
1829
- [
1830
- "+]",
1831
- "/"
1832
- ],
1833
- [
1834
- "CCC",
1835
- "SCC"
1836
- ],
1837
- [
1838
- "OCC",
1839
- "n"
1840
- ],
1841
- [
1842
- "cs",
1843
- "nn"
1844
- ],
1845
- [
1846
- "@",
1847
- "](["
1848
- ],
1849
- [
1850
- "C",
1851
- "Br"
1852
- ],
1853
- [
1854
- "4",
1855
- "5"
1856
- ],
1857
- [
1858
- "cc",
1859
- "no"
1860
- ],
1861
- [
1862
- "O",
1863
- "CCCC"
1864
- ],
1865
- [
1866
- "](",
1867
- "/"
1868
- ],
1869
- [
1870
- ")(",
1871
- "/"
1872
- ],
1873
- [
1874
- "CS",
1875
- "CCC"
1876
- ],
1877
- [
1878
- "s",
1879
- "nc"
1880
- ],
1881
- [
1882
- "@@",
1883
- "](["
1884
- ],
1885
- [
1886
- "CO",
1887
- "CCc"
1888
- ],
1889
- [
1890
- "O",
1891
- "N"
1892
- ],
1893
- [
1894
- "CCC",
1895
- "SC"
1896
- ],
1897
- [
1898
- "2",
1899
- "4"
1900
- ],
1901
- [
1902
- "+]",
1903
- ")(["
1904
- ],
1905
- [
1906
- "O",
1907
- "COC"
1908
- ],
1909
- [
1910
- "ccnc",
1911
- "n"
1912
- ],
1913
- [
1914
- "N",
1915
- "CCSc"
1916
- ],
1917
- [
1918
- "CCC",
1919
- "OCC"
1920
- ],
1921
- [
1922
- "CCN",
1923
- "CC"
1924
- ],
1925
- [
1926
- "nn",
1927
- "cc"
1928
- ],
1929
- [
1930
- "CCCCC",
1931
- "NC"
1932
- ],
1933
- [
1934
- "(/",
1935
- "["
1936
- ],
1937
- [
1938
- "5",
1939
- "4"
1940
- ],
1941
- [
1942
- "nc",
1943
- "on"
1944
- ],
1945
- [
1946
- "CO",
1947
- "CCCC"
1948
- ],
1949
- [
1950
- "N",
1951
- "CCOC"
1952
- ],
1953
- [
1954
- "CCCC",
1955
- "OC"
1956
- ],
1957
- [
1958
- "CS",
1959
- "CCN"
1960
- ],
1961
- [
1962
- "ncc",
1963
- "o"
1964
- ],
1965
- [
1966
- "CCS",
1967
- "Cc"
1968
- ],
1969
- [
1970
- "nnc",
1971
- "o"
1972
- ],
1973
- [
1974
- "CO",
1975
- "NC"
1976
- ],
1977
- [
1978
- "s",
1979
- "nnc"
1980
- ],
1981
- [
1982
- "CO",
1983
- "CCOC"
1984
- ],
1985
- [
1986
- "4",
1987
- "2"
1988
- ],
1989
- [
1990
- "nc",
1991
- "ncc"
1992
- ],
1993
- [
1994
- "CCN",
1995
- "Cc"
1996
- ],
1997
- [
1998
- "N",
1999
- "CCOCC"
2000
- ],
2001
- [
2002
- "N",
2003
- "NS"
2004
- ],
2005
- [
2006
- "O",
2007
- "CCCN"
2008
- ],
2009
- [
2010
- "N",
2011
- "OCc"
2012
- ],
2013
- [
2014
- "OCC",
2015
- "Cc"
2016
- ],
2017
- [
2018
- ")",
2019
- "\\"
2020
- ],
2021
- [
2022
- "N",
2023
- "CCCCn"
2024
- ],
2025
- [
2026
- "O",
2027
- "CCCNC"
2028
- ],
2029
- [
2030
- "S",
2031
- "CCOc"
2032
- ],
2033
- [
2034
- "CCC",
2035
- "F"
2036
- ],
2037
- [
2038
- "CCCN",
2039
- "S"
2040
- ],
2041
- [
2042
- "OCC",
2043
- "Nc"
2044
- ],
2045
- [
2046
- "CCCC",
2047
- "l"
2048
- ],
2049
- [
2050
- "CCO",
2051
- "CCO"
2052
- ],
2053
- [
2054
- "NCCC",
2055
- "OC"
2056
- ],
2057
- [
2058
- "O",
2059
- "CCS"
2060
- ],
2061
- [
2062
- "S",
2063
- "CCS"
2064
- ],
2065
- [
2066
- "o",
2067
- "cc"
2068
- ],
2069
- [
2070
- "CN",
2071
- "CCc"
2072
- ],
2073
- [
2074
- "CCCCC",
2075
- "n"
2076
- ],
2077
- [
2078
- "CO",
2079
- "CCCn"
2080
- ],
2081
- [
2082
- "CN",
2083
- "CC"
2084
- ],
2085
- [
2086
- "CCO",
2087
- "CCCNC"
2088
- ],
2089
- [
2090
- "NCCC",
2091
- "NC"
2092
- ],
2093
- [
2094
- "Cl",
2095
- "C"
2096
- ],
2097
- [
2098
- "-]",
2099
- ")("
2100
- ],
2101
- [
2102
- "-])",
2103
- "=["
2104
- ],
2105
- [
2106
- "O",
2107
- "CCOC"
2108
- ],
2109
- [
2110
- "cn",
2111
- "oc"
2112
- ],
2113
- [
2114
- "cnc",
2115
- "s"
2116
- ],
2117
- [
2118
- "NC",
2119
- "N"
2120
- ],
2121
- [
2122
- "CCCC",
2123
- "Sc"
2124
- ],
2125
- [
2126
- "CN",
2127
- "n"
2128
- ],
2129
- [
2130
- "CCO",
2131
- "CCC"
2132
- ],
2133
- [
2134
- "NCCC",
2135
- "Sc"
2136
- ],
2137
- [
2138
- "S",
2139
- "CCO"
2140
- ],
2141
- [
2142
- "CCCC",
2143
- "Nc"
2144
- ],
2145
- [
2146
- "CCO",
2147
- "NC"
2148
- ],
2149
- [
2150
- "N",
2151
- "OC"
2152
- ],
2153
- [
2154
- "CO",
2155
- "CO"
2156
- ],
2157
- [
2158
- "CN",
2159
- "N"
2160
- ],
2161
- [
2162
- "CN",
2163
- "CCN"
2164
- ],
2165
- [
2166
- "-]",
2167
- "["
2168
- ],
2169
- [
2170
- "CCOCC",
2171
- "NC"
2172
- ],
2173
- [
2174
- "NCCC",
2175
- "S"
2176
- ],
2177
- [
2178
- "NCCC",
2179
- "Oc"
2180
- ],
2181
- [
2182
- "N",
2183
- "CCCCC"
2184
- ],
2185
- [
2186
- "O",
2187
- "CCSc"
2188
- ],
2189
- [
2190
- "]",
2191
- "/"
2192
- ],
2193
- [
2194
- "OC",
2195
- "n"
2196
- ],
2197
- [
2198
- "CS",
2199
- "CCNC"
2200
- ],
2201
- [
2202
- "N",
2203
- "OCC"
2204
- ],
2205
- [
2206
- "O",
2207
- "CCCn"
2208
- ],
2209
- [
2210
- "cc",
2211
- "s"
2212
- ],
2213
- [
2214
- "+]",
2215
- "=["
2216
- ],
2217
- [
2218
- "OC",
2219
- "N"
2220
- ],
2221
- [
2222
- "(-",
2223
- "["
2224
- ],
2225
- [
2226
- "CCO",
2227
- "CCCC"
2228
- ],
2229
- [
2230
- "CCCCC",
2231
- "O"
2232
- ],
2233
- [
2234
- "CCOCC",
2235
- "S"
2236
- ],
2237
- [
2238
- "CCOCC",
2239
- "n"
2240
- ],
2241
- [
2242
- "CCS",
2243
- "CCC"
2244
- ],
2245
- [
2246
- "COCC",
2247
- "Nc"
2248
- ],
2249
- [
2250
- "NCCN",
2251
- "S"
2252
- ],
2253
- [
2254
- "S",
2255
- "CCCS"
2256
- ],
2257
- [
2258
- "s",
2259
- "n"
2260
- ],
2261
- [
2262
- "cc",
2263
- "nnc"
2264
- ],
2265
- [
2266
- "CC",
2267
- "Br"
2268
- ],
2269
- [
2270
- "CO",
2271
- "CCOCC"
2272
- ],
2273
- [
2274
- "CO",
2275
- "CCSc"
2276
- ],
2277
- [
2278
- "Cl",
2279
- "Cc"
2280
- ],
2281
- [
2282
- "CCCC",
2283
- "Cc"
2284
- ],
2285
- [
2286
- "-]",
2287
- "/"
2288
- ],
2289
- [
2290
- "CS",
2291
- "CCCNC"
2292
- ],
2293
- [
2294
- "cnc",
2295
- "o"
2296
- ],
2297
- [
2298
- "cnn",
2299
- "s"
2300
- ],
2301
- [
2302
- ")/",
2303
- "["
2304
- ],
2305
- [
2306
- "COCCN",
2307
- "S"
2308
- ],
2309
- [
2310
- "O",
2311
- "CCCOc"
2312
- ],
2313
- [
2314
- "]",
2315
- "["
2316
- ],
2317
- [
2318
- "CO",
2319
- "CCCOc"
2320
- ],
2321
- [
2322
- "CS",
2323
- "CCCN"
2324
- ],
2325
- [
2326
- "NCC",
2327
- "CCN"
2328
- ],
2329
- [
2330
- "CO",
2331
- "CCS"
2332
- ],
2333
- [
2334
- "CO",
2335
- "CCCNc"
2336
- ],
2337
- [
2338
- "CCO",
2339
- "CCOc"
2340
- ],
2341
- [
2342
- "CCCCC",
2343
- "S"
2344
- ],
2345
- [
2346
- "N",
2347
- "CCSC"
2348
- ],
2349
- [
2350
- "O",
2351
- "P"
2352
- ],
2353
- [
2354
- "S",
2355
- "CCCC"
2356
- ],
2357
- [
2358
- "CO",
2359
- "n"
2360
- ],
2361
- [
2362
- "CO",
2363
- "CCCOC"
2364
- ],
2365
- [
2366
- "CCCC",
2367
- "OCC"
2368
- ],
2369
- [
2370
- "CCCC",
2371
- "CCNC"
2372
- ],
2373
- [
2374
- "CS",
2375
- "CCc"
2376
- ],
2377
- [
2378
- "CS",
2379
- "CCn"
2380
- ],
2381
- [
2382
- "Br",
2383
- "Cc"
2384
- ],
2385
- [
2386
- "NCCCN",
2387
- "S"
2388
- ],
2389
- [
2390
- "3",
2391
- "5"
2392
- ],
2393
- [
2394
- "S",
2395
- "CCn"
2396
- ],
2397
- [
2398
- "o",
2399
- "ncc"
2400
- ],
2401
- [
2402
- "CO",
2403
- "P"
2404
- ],
2405
- [
2406
- "Cl",
2407
- "CC"
2408
- ],
2409
- [
2410
- "-]",
2411
- "=["
2412
- ],
2413
- [
2414
- "CCO",
2415
- "P"
2416
- ],
2417
- [
2418
- "CS",
2419
- "CCCCNC"
2420
- ],
2421
- [
2422
- "cn",
2423
- "sn"
2424
- ],
2425
- [
2426
- "OCCO",
2427
- "CCOCCO"
2428
- ],
2429
- [
2430
- "NCCC",
2431
- "Nc"
2432
- ],
2433
- [
2434
- "OCCC",
2435
- "l"
2436
- ],
2437
- [
2438
- "OCCC",
2439
- "Sc"
2440
- ],
2441
- [
2442
- "C",
2443
- "I"
2444
- ],
2445
- [
2446
- "N",
2447
- "CCCCCC"
2448
- ],
2449
- [
2450
- "N",
2451
- "CCSCC"
2452
- ],
2453
- [
2454
- "N",
2455
- "CCOCc"
2456
- ],
2457
- [
2458
- "O",
2459
- "CCCCC"
2460
- ],
2461
- [
2462
- "O",
2463
- "CCNS"
2464
- ],
2465
- [
2466
- "O",
2467
- "CCSCc"
2468
- ],
2469
- [
2470
- "S",
2471
- "CN"
2472
- ],
2473
- [
2474
- "S",
2475
- "Cn"
2476
- ],
2477
- [
2478
- "S",
2479
- "CCNC"
2480
- ],
2481
- [
2482
- "S",
2483
- "CCCOc"
2484
- ],
2485
- [
2486
- "c",
2487
- "onc"
2488
- ],
2489
- [
2490
- "CO",
2491
- "COc"
2492
- ],
2493
- [
2494
- "CCCC",
2495
- "CCCCCCC"
2496
- ],
2497
- [
2498
- "CCO",
2499
- "CCOC"
2500
- ],
2501
- [
2502
- "CCOCC",
2503
- "Cc"
2504
- ],
2505
- [
2506
- "OCC",
2507
- "CCN"
2508
- ],
2509
- [
2510
- "CCCO",
2511
- "Cc"
2512
- ],
2513
- [
2514
- "NCCC",
2515
- "OCC"
2516
- ],
2517
- [
2518
- "ns",
2519
- "cc"
2520
- ],
2521
- [
2522
- "NCCCC",
2523
- "l"
2524
- ],
2525
- [
2526
- "NCCCC",
2527
- "Oc"
2528
- ],
2529
- [
2530
- "4",
2531
- "1"
2532
- ],
2533
- [
2534
- "C",
2535
- "H"
2536
- ],
2537
- [
2538
- "N",
2539
- "SC"
2540
- ],
2541
- [
2542
- "O",
2543
- "H"
2544
- ],
2545
- [
2546
- "O",
2547
- "n"
2548
- ],
2549
- [
2550
- "O",
2551
- "CCOCC"
2552
- ],
2553
- [
2554
- "O",
2555
- "CCSCC"
2556
- ],
2557
- [
2558
- "O",
2559
- "CCCS"
2560
- ],
2561
- [
2562
- "S",
2563
- "N"
2564
- ],
2565
- [
2566
- "S",
2567
- "CCCc"
2568
- ],
2569
- [
2570
- "](",
2571
- "/["
2572
- ],
2573
- [
2574
- "CCC",
2575
- "SCc"
2576
- ],
2577
- [
2578
- "CO",
2579
- "S"
2580
- ],
2581
- [
2582
- "CO",
2583
- "CCCCC"
2584
- ],
2585
- [
2586
- "CCCC",
2587
- "CCCC"
2588
- ],
2589
- [
2590
- "CCCC",
2591
- "CCO"
2592
- ],
2593
- [
2594
- "CCCC",
2595
- "CCS"
2596
- ],
2597
- [
2598
- "CN",
2599
- "CCC"
2600
- ],
2601
- [
2602
- "-]",
2603
- ")(["
2604
- ],
2605
- [
2606
- "CCO",
2607
- "CCCN"
2608
- ],
2609
- [
2610
- "CCO",
2611
- "CCCNc"
2612
- ],
2613
- [
2614
- "CCO",
2615
- "CCOCc"
2616
- ],
2617
- [
2618
- "+](",
2619
- "-"
2620
- ],
2621
- [
2622
- "CS",
2623
- "CCOc"
2624
- ],
2625
- [
2626
- "CS",
2627
- "CCSC"
2628
- ],
2629
- [
2630
- "CCCN",
2631
- "CC"
2632
- ],
2633
- [
2634
- "cn",
2635
- "sc"
2636
- ],
2637
- [
2638
- "CCOCC",
2639
- "Nc"
2640
- ],
2641
- [
2642
- "CCS",
2643
- "S"
2644
- ],
2645
- [
2646
- "CCS",
2647
- "CCOC"
2648
- ],
2649
- [
2650
- "OCC",
2651
- "F"
2652
- ],
2653
- [
2654
- "OCC",
2655
- "Br"
2656
- ],
2657
- [
2658
- "NCCS",
2659
- "Cc"
2660
- ],
2661
- [
2662
- "(",
2663
- "#"
2664
- ],
2665
- [
2666
- "-",
2667
- "["
2668
- ],
2669
- [
2670
- "3",
2671
- "12"
2672
- ],
2673
- [
2674
- "F",
2675
- "CCC"
2676
- ],
2677
- [
2678
- "I",
2679
- "C"
2680
- ],
2681
- [
2682
- "I",
2683
- "c"
2684
- ],
2685
- [
2686
- "N",
2687
- "Oc"
2688
- ],
2689
- [
2690
- "O",
2691
- "NC"
2692
- ],
2693
- [
2694
- "O",
2695
- "CCSC"
2696
- ],
2697
- [
2698
- "O",
2699
- "CCCCn"
2700
- ],
2701
- [
2702
- "O",
2703
- "CCOCCS"
2704
- ],
2705
- [
2706
- "S",
2707
- "H"
2708
- ],
2709
- [
2710
- "S",
2711
- "CCOC"
2712
- ],
2713
- [
2714
- "S",
2715
- "CCCO"
2716
- ],
2717
- [
2718
- "S",
2719
- "CCSc"
2720
- ],
2721
- [
2722
- "s",
2723
- "sc"
2724
- ],
2725
- [
2726
- "s",
2727
- "snc"
2728
- ],
2729
- [
2730
- "CCC",
2731
- "Br"
2732
- ],
2733
- [
2734
- "CCC",
2735
- "NCc"
2736
- ],
2737
- [
2738
- "CO",
2739
- "CCCCN"
2740
- ],
2741
- [
2742
- "CO",
2743
- "CCCS"
2744
- ],
2745
- [
2746
- "CO",
2747
- "CCSCc"
2748
- ],
2749
- [
2750
- "CO",
2751
- "CCOCCNC"
2752
- ],
2753
- [
2754
- "Cl",
2755
- "CCCSc"
2756
- ],
2757
- [
2758
- "CCCC",
2759
- "CCN"
2760
- ],
2761
- [
2762
- "CCCC",
2763
- "SC"
2764
- ],
2765
- [
2766
- "CCCC",
2767
- "OCc"
2768
- ],
2769
- [
2770
- "CCO",
2771
- "CCOCC"
2772
- ],
2773
- [
2774
- "CCO",
2775
- "CCCn"
2776
- ],
2777
- [
2778
- "nn",
2779
- "ccc"
2780
- ],
2781
- [
2782
- "-])",
2783
- "\\"
2784
- ],
2785
- [
2786
- "+](",
2787
- "/"
2788
- ],
2789
- [
2790
- "+](",
2791
- "/["
2792
- ],
2793
- [
2794
- "CS",
2795
- "CCCC"
2796
- ],
2797
- [
2798
- "CS",
2799
- "CCOC"
2800
- ],
2801
- [
2802
- "CS",
2803
- "CCCNc"
2804
- ],
2805
- [
2806
- "Br",
2807
- "CC"
2808
- ],
2809
- [
2810
- "Br",
2811
- "CCC"
2812
- ],
2813
- [
2814
- "12",
2815
- "3"
2816
- ],
2817
- [
2818
- "CCCCC",
2819
- "OC"
2820
- ],
2821
- [
2822
- "CCCCC",
2823
- "Oc"
2824
- ],
2825
- [
2826
- "CCCCC",
2827
- "Sc"
2828
- ],
2829
- [
2830
- "CCOCC",
2831
- "Sc"
2832
- ],
2833
- [
2834
- "CCS",
2835
- "CCOc"
2836
- ],
2837
- [
2838
- "NN",
2839
- "N"
2840
- ],
2841
- [
2842
- "NCCC",
2843
- "SC"
2844
- ],
2845
- [
2846
- "CCCCN",
2847
- "S"
2848
- ],
2849
- [
2850
- "COCCN",
2851
- "Cc"
2852
- ],
2853
- [
2854
- "OCCC",
2855
- "Nc"
2856
- ],
2857
- [
2858
- "OCCC",
2859
- "SC"
2860
- ],
2861
- [
2862
- "NO",
2863
- "CCc"
2864
- ],
2865
- [
2866
- "COCCO",
2867
- "CCN"
2868
- ],
2869
- [
2870
- "NCCO",
2871
- "CCO"
2872
- ],
2873
- [
2874
- "CCOCCO",
2875
- "CCOCC"
2876
- ],
2877
- [
2878
- "OCCOCCOCCO",
2879
- "CCO"
2880
- ]
2881
  ]
2882
  }
2883
  }
 
854
  "OCCOCCOCCOCCO": 766
855
  },
856
  "merges": [
857
+ "c c",
858
+ "C C",
859
+ "( =",
860
+ "cc c",
861
+ "] (",
862
+ "@ @",
863
+ "C c",
864
+ "N C",
865
+ "cc ccc",
866
+ "n c",
867
+ "CC C",
868
+ ") [",
869
+ "N H",
870
+ "+ ]",
871
+ "C O",
872
+ "cc cc",
873
+ "N c",
874
+ "C l",
875
+ "O C",
876
+ "CC N",
877
+ ") (",
878
+ "CO c",
879
+ "( -",
880
+ "( [",
881
+ "CC CC",
882
+ "C N",
883
+ ") (=",
884
+ "- ]",
885
+ "CC O",
886
+ "n H",
887
+ "n n",
888
+ "-] )",
889
+ "+ ](",
890
+ "CC c",
891
+ ") =",
892
+ "s c",
893
+ "C S",
894
+ "n cc",
895
+ "B r",
896
+ "C NC",
897
+ "n nc",
898
+ "N Cc",
899
+ "o c",
900
+ "1 2",
901
+ "CC CCC",
902
+ "+] (=",
903
+ "CO C",
904
+ "C n",
905
+ "2 1",
906
+ "CCC N",
907
+ "c n",
908
+ "O c",
909
+ "CC OC",
910
+ "+] [",
911
+ "CCO CC",
912
+ "c nc",
913
+ "CC S",
914
+ "]( [",
915
+ "CCO c",
916
+ "ccc s",
917
+ "ccc nc",
918
+ "N CC",
919
+ "O CC",
920
+ "( /",
921
+ "CCC O",
922
+ "@ ]",
923
+ "CS c",
924
+ "ccc o",
925
+ "@@ ]",
926
+ "c nn",
927
+ "CC n",
928
+ "CC NC",
929
+ "3 2",
930
+ "cccc n",
931
+ "2 3",
932
+ "n o",
933
+ "+] )",
934
+ "n oc",
935
+ ") /",
936
+ "c sc",
937
+ "c s",
938
+ "cc ncc",
939
+ "ccc n",
940
+ "CC Cc",
941
+ "S c",
942
+ "S CC",
943
+ "cc nc",
944
+ "S C",
945
+ "O Cc",
946
+ "cc sc",
947
+ "cc n",
948
+ "N NC",
949
+ "O CO",
950
+ "@ ](",
951
+ "nc nc",
952
+ "N S",
953
+ "N CCc",
954
+ "@@ ](",
955
+ "C Nc",
956
+ "O CCO",
957
+ "= [",
958
+ "n cccc",
959
+ "c ncc",
960
+ "N N",
961
+ "CCCC CC",
962
+ "N CCC",
963
+ "o n",
964
+ "+]( [",
965
+ "CC CCN",
966
+ "CCC NC",
967
+ "nc n",
968
+ "-] )[",
969
+ "ncc s",
970
+ "+] =",
971
+ "CS C",
972
+ "CCC n",
973
+ "s ccc",
974
+ "S Cc",
975
+ "CCS c",
976
+ "cnc n",
977
+ "( \\",
978
+ "CO CC",
979
+ "3 4",
980
+ "nn nn",
981
+ "n ccc",
982
+ "CO Cc",
983
+ "cc oc",
984
+ ")( [",
985
+ "ncc n",
986
+ "CCC Oc",
987
+ "n cccn",
988
+ "cc nn",
989
+ "CN S",
990
+ "@@] (=",
991
+ "CCS C",
992
+ "4 3",
993
+ "CO CCN",
994
+ "F c",
995
+ "CCS CC",
996
+ "CCC S",
997
+ "cncc n",
998
+ "-]) =",
999
+ "/ [",
1000
+ "@] (=",
1001
+ "c oc",
1002
+ "c nnc",
1003
+ "CS CC",
1004
+ "nn n",
1005
+ "N Nc",
1006
+ "nn nc",
1007
+ "N CCN",
1008
+ "nnc n",
1009
+ "+] )[",
1010
+ "CCCC O",
1011
+ "nc nn",
1012
+ "CC l",
1013
+ "CC Nc",
1014
+ "Cl c",
1015
+ "CS Cc",
1016
+ "O CCCO",
1017
+ "cnn n",
1018
+ "NCC NC",
1019
+ "o ccc",
1020
+ "o nc",
1021
+ "CCN S",
1022
+ "O CCC",
1023
+ ")= [",
1024
+ "CCC OC",
1025
+ "CCCC NC",
1026
+ "CO CCn",
1027
+ "ncc nc",
1028
+ "F C",
1029
+ "CCCC CCC",
1030
+ "cs cc",
1031
+ "1 3",
1032
+ "N O",
1033
+ "cn ccc",
1034
+ "(\\ [",
1035
+ "O CCN",
1036
+ "n s",
1037
+ "n sc",
1038
+ "CO CCNC",
1039
+ "N CCOc",
1040
+ "CCCC n",
1041
+ "csc n",
1042
+ "NCC n",
1043
+ "NCCC n",
1044
+ "+] )(",
1045
+ "NCC Cc",
1046
+ "CCCC c",
1047
+ "cc on",
1048
+ "sc nc",
1049
+ "CCC Nc",
1050
+ "nc sc",
1051
+ "N n",
1052
+ "N CCCN",
1053
+ "no nc",
1054
+ "Br c",
1055
+ "N CCS",
1056
+ "S CCC",
1057
+ "CO CCO",
1058
+ "nnc s",
1059
+ "CN Cc",
1060
+ "s cc",
1061
+ "s ccn",
1062
+ "N CCCC",
1063
+ "(= [",
1064
+ "CO CCOc",
1065
+ "3 1",
1066
+ "oc nc",
1067
+ "ns nc",
1068
+ "O CCc",
1069
+ "CCO Cc",
1070
+ "O S",
1071
+ "nc oc",
1072
+ "cnc nc",
1073
+ "CO CCC",
1074
+ "NCC Nc",
1075
+ "CCC l",
1076
+ "nn sc",
1077
+ "CS CCS",
1078
+ "CO CCCNC",
1079
+ "S CCc",
1080
+ "c o",
1081
+ "CCCC S",
1082
+ "OCC NC",
1083
+ "N CCO",
1084
+ "CCC Sc",
1085
+ "+] \\",
1086
+ "-]) /",
1087
+ "CS CN",
1088
+ "CCCC Oc",
1089
+ "\\ [",
1090
+ "CCCCC N",
1091
+ "CO CCCN",
1092
+ "CS CCO",
1093
+ ") -",
1094
+ "O CCOc",
1095
+ "ccc nn",
1096
+ "CO N",
1097
+ "CCO CCN",
1098
+ "N CCCO",
1099
+ "S CCN",
1100
+ "+] /",
1101
+ "CCC SCC",
1102
+ "OCC n",
1103
+ "cs nn",
1104
+ "@ ]([",
1105
+ "C Br",
1106
+ "4 5",
1107
+ "cc no",
1108
+ "O CCCC",
1109
+ "]( /",
1110
+ ")( /",
1111
+ "CS CCC",
1112
+ "s nc",
1113
+ "@@ ]([",
1114
+ "CO CCc",
1115
+ "O N",
1116
+ "CCC SC",
1117
+ "2 4",
1118
+ "+] )([",
1119
+ "O COC",
1120
+ "ccnc n",
1121
+ "N CCSc",
1122
+ "CCC OCC",
1123
+ "CCN CC",
1124
+ "nn cc",
1125
+ "CCCCC NC",
1126
+ "(/ [",
1127
+ "5 4",
1128
+ "nc on",
1129
+ "CO CCCC",
1130
+ "N CCOC",
1131
+ "CCCC OC",
1132
+ "CS CCN",
1133
+ "ncc o",
1134
+ "CCS Cc",
1135
+ "nnc o",
1136
+ "CO NC",
1137
+ "s nnc",
1138
+ "CO CCOC",
1139
+ "4 2",
1140
+ "nc ncc",
1141
+ "CCN Cc",
1142
+ "N CCOCC",
1143
+ "N NS",
1144
+ "O CCCN",
1145
+ "N OCc",
1146
+ "OCC Cc",
1147
+ ") \\",
1148
+ "N CCCCn",
1149
+ "O CCCNC",
1150
+ "S CCOc",
1151
+ "CCC F",
1152
+ "CCCN S",
1153
+ "OCC Nc",
1154
+ "CCCC l",
1155
+ "CCO CCO",
1156
+ "NCCC OC",
1157
+ "O CCS",
1158
+ "S CCS",
1159
+ "o cc",
1160
+ "CN CCc",
1161
+ "CCCCC n",
1162
+ "CO CCCn",
1163
+ "CN CC",
1164
+ "CCO CCCNC",
1165
+ "NCCC NC",
1166
+ "Cl C",
1167
+ "-] )(",
1168
+ "-]) =[",
1169
+ "O CCOC",
1170
+ "cn oc",
1171
+ "cnc s",
1172
+ "NC N",
1173
+ "CCCC Sc",
1174
+ "CN n",
1175
+ "CCO CCC",
1176
+ "NCCC Sc",
1177
+ "S CCO",
1178
+ "CCCC Nc",
1179
+ "CCO NC",
1180
+ "N OC",
1181
+ "CO CO",
1182
+ "CN N",
1183
+ "CN CCN",
1184
+ "-] [",
1185
+ "CCOCC NC",
1186
+ "NCCC S",
1187
+ "NCCC Oc",
1188
+ "N CCCCC",
1189
+ "O CCSc",
1190
+ "] /",
1191
+ "OC n",
1192
+ "CS CCNC",
1193
+ "N OCC",
1194
+ "O CCCn",
1195
+ "cc s",
1196
+ "+] =[",
1197
+ "OC N",
1198
+ "(- [",
1199
+ "CCO CCCC",
1200
+ "CCCCC O",
1201
+ "CCOCC S",
1202
+ "CCOCC n",
1203
+ "CCS CCC",
1204
+ "COCC Nc",
1205
+ "NCCN S",
1206
+ "S CCCS",
1207
+ "s n",
1208
+ "cc nnc",
1209
+ "CC Br",
1210
+ "CO CCOCC",
1211
+ "CO CCSc",
1212
+ "Cl Cc",
1213
+ "CCCC Cc",
1214
+ "-] /",
1215
+ "CS CCCNC",
1216
+ "cnc o",
1217
+ "cnn s",
1218
+ ")/ [",
1219
+ "COCCN S",
1220
+ "O CCCOc",
1221
+ "] [",
1222
+ "CO CCCOc",
1223
+ "CS CCCN",
1224
+ "NCC CCN",
1225
+ "CO CCS",
1226
+ "CO CCCNc",
1227
+ "CCO CCOc",
1228
+ "CCCCC S",
1229
+ "N CCSC",
1230
+ "O P",
1231
+ "S CCCC",
1232
+ "CO n",
1233
+ "CO CCCOC",
1234
+ "CCCC OCC",
1235
+ "CCCC CCNC",
1236
+ "CS CCc",
1237
+ "CS CCn",
1238
+ "Br Cc",
1239
+ "NCCCN S",
1240
+ "3 5",
1241
+ "S CCn",
1242
+ "o ncc",
1243
+ "CO P",
1244
+ "Cl CC",
1245
+ "-] =[",
1246
+ "CCO P",
1247
+ "CS CCCCNC",
1248
+ "cn sn",
1249
+ "OCCO CCOCCO",
1250
+ "NCCC Nc",
1251
+ "OCCC l",
1252
+ "OCCC Sc",
1253
+ "C I",
1254
+ "N CCCCCC",
1255
+ "N CCSCC",
1256
+ "N CCOCc",
1257
+ "O CCCCC",
1258
+ "O CCNS",
1259
+ "O CCSCc",
1260
+ "S CN",
1261
+ "S Cn",
1262
+ "S CCNC",
1263
+ "S CCCOc",
1264
+ "c onc",
1265
+ "CO COc",
1266
+ "CCCC CCCCCCC",
1267
+ "CCO CCOC",
1268
+ "CCOCC Cc",
1269
+ "OCC CCN",
1270
+ "CCCO Cc",
1271
+ "NCCC OCC",
1272
+ "ns cc",
1273
+ "NCCCC l",
1274
+ "NCCCC Oc",
1275
+ "4 1",
1276
+ "C H",
1277
+ "N SC",
1278
+ "O H",
1279
+ "O n",
1280
+ "O CCOCC",
1281
+ "O CCSCC",
1282
+ "O CCCS",
1283
+ "S N",
1284
+ "S CCCc",
1285
+ "]( /[",
1286
+ "CCC SCc",
1287
+ "CO S",
1288
+ "CO CCCCC",
1289
+ "CCCC CCCC",
1290
+ "CCCC CCO",
1291
+ "CCCC CCS",
1292
+ "CN CCC",
1293
+ "-] )([",
1294
+ "CCO CCCN",
1295
+ "CCO CCCNc",
1296
+ "CCO CCOCc",
1297
+ "+]( -",
1298
+ "CS CCOc",
1299
+ "CS CCSC",
1300
+ "CCCN CC",
1301
+ "cn sc",
1302
+ "CCOCC Nc",
1303
+ "CCS S",
1304
+ "CCS CCOC",
1305
+ "OCC F",
1306
+ "OCC Br",
1307
+ "NCCS Cc",
1308
+ "( #",
1309
+ "- [",
1310
+ "3 12",
1311
+ "F CCC",
1312
+ "I C",
1313
+ "I c",
1314
+ "N Oc",
1315
+ "O NC",
1316
+ "O CCSC",
1317
+ "O CCCCn",
1318
+ "O CCOCCS",
1319
+ "S H",
1320
+ "S CCOC",
1321
+ "S CCCO",
1322
+ "S CCSc",
1323
+ "s sc",
1324
+ "s snc",
1325
+ "CCC Br",
1326
+ "CCC NCc",
1327
+ "CO CCCCN",
1328
+ "CO CCCS",
1329
+ "CO CCSCc",
1330
+ "CO CCOCCNC",
1331
+ "Cl CCCSc",
1332
+ "CCCC CCN",
1333
+ "CCCC SC",
1334
+ "CCCC OCc",
1335
+ "CCO CCOCC",
1336
+ "CCO CCCn",
1337
+ "nn ccc",
1338
+ "-]) \\",
1339
+ "+]( /",
1340
+ "+]( /[",
1341
+ "CS CCCC",
1342
+ "CS CCOC",
1343
+ "CS CCCNc",
1344
+ "Br CC",
1345
+ "Br CCC",
1346
+ "12 3",
1347
+ "CCCCC OC",
1348
+ "CCCCC Oc",
1349
+ "CCCCC Sc",
1350
+ "CCOCC Sc",
1351
+ "CCS CCOc",
1352
+ "NN N",
1353
+ "NCCC SC",
1354
+ "CCCCN S",
1355
+ "COCCN Cc",
1356
+ "OCCC Nc",
1357
+ "OCCC SC",
1358
+ "NO CCc",
1359
+ "COCCO CCN",
1360
+ "NCCO CCO",
1361
+ "CCOCCO CCOCC",
1362
+ "OCCOCCOCCO CCO"
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1363
  ]
1364
  }
1365
  }
tokenizer_config.json CHANGED
@@ -47,7 +47,6 @@
47
  "cls_token": "<s>",
48
  "eos_token": "</s>",
49
  "errors": "replace",
50
- "extra_special_tokens": {},
51
  "mask_token": "<mask>",
52
  "max_len": 512,
53
  "model_max_length": 512,
 
47
  "cls_token": "<s>",
48
  "eos_token": "</s>",
49
  "errors": "replace",
 
50
  "mask_token": "<mask>",
51
  "max_len": 512,
52
  "model_max_length": 512,