Update tiny models for VisionTextDualEncoderModel-vit-bert

#19
Files changed (7) hide show
  1. config.json +5 -4
  2. preprocessor_config.json +1 -1
  3. pytorch_model.bin +1 -1
  4. tf_model.h5 +3 -0
  5. tokenizer.json +330 -330
  6. tokenizer_config.json +1 -1
  7. vocab.txt +278 -278
config.json CHANGED
@@ -1,5 +1,6 @@
1
  {
2
  "_commit_hash": null,
 
3
  "architectures": [
4
  "VisionTextDualEncoderModel"
5
  ],
@@ -7,7 +8,7 @@
7
  "model_type": "vision-text-dual-encoder",
8
  "projection_dim": 512,
9
  "text_config": {
10
- "_name_or_path": "/tmp/tmpwmqhff1f/decoder/BertModel",
11
  "add_cross_attention": false,
12
  "architectures": [
13
  "BertModel"
@@ -80,7 +81,7 @@
80
  "top_p": 1.0,
81
  "torch_dtype": "float32",
82
  "torchscript": false,
83
- "transformers_version": "4.25.0.dev0",
84
  "type_vocab_size": 16,
85
  "typical_p": 1.0,
86
  "use_bfloat16": false,
@@ -90,7 +91,7 @@
90
  "torch_dtype": "float32",
91
  "transformers_version": null,
92
  "vision_config": {
93
- "_name_or_path": "/tmp/tmpwmqhff1f/encoder/ViTModel",
94
  "add_cross_attention": false,
95
  "architectures": [
96
  "ViTModel"
@@ -165,7 +166,7 @@
165
  "top_p": 1.0,
166
  "torch_dtype": "float32",
167
  "torchscript": false,
168
- "transformers_version": "4.25.0.dev0",
169
  "typical_p": 1.0,
170
  "use_bfloat16": false
171
  }
 
1
  {
2
  "_commit_hash": null,
3
+ "_name_or_path": "tiny_models/vision-text-dual-encoder/VisionTextDualEncoderModel-vit-bert",
4
  "architectures": [
5
  "VisionTextDualEncoderModel"
6
  ],
 
8
  "model_type": "vision-text-dual-encoder",
9
  "projection_dim": 512,
10
  "text_config": {
11
+ "_name_or_path": "/tmp/tmpd0c4m8ak/decoder/BertModel",
12
  "add_cross_attention": false,
13
  "architectures": [
14
  "BertModel"
 
81
  "top_p": 1.0,
82
  "torch_dtype": "float32",
83
  "torchscript": false,
84
+ "transformers_version": "4.28.0.dev0",
85
  "type_vocab_size": 16,
86
  "typical_p": 1.0,
87
  "use_bfloat16": false,
 
91
  "torch_dtype": "float32",
92
  "transformers_version": null,
93
  "vision_config": {
94
+ "_name_or_path": "/tmp/tmpd0c4m8ak/encoder/ViTModel",
95
  "add_cross_attention": false,
96
  "architectures": [
97
  "ViTModel"
 
166
  "top_p": 1.0,
167
  "torch_dtype": "float32",
168
  "torchscript": false,
169
+ "transformers_version": "4.28.0.dev0",
170
  "typical_p": 1.0,
171
  "use_bfloat16": false
172
  }
preprocessor_config.json CHANGED
@@ -8,7 +8,7 @@
8
  0.5,
9
  0.5
10
  ],
11
- "image_processor_type": "ViTImageProcessor",
12
  "image_std": [
13
  0.5,
14
  0.5,
 
8
  0.5,
9
  0.5
10
  ],
11
+ "image_processor_type": "ViTFeatureExtractor",
12
  "image_std": [
13
  0.5,
14
  0.5,
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:3fb46eeeef53c003470020f7534b354d9d97f6195f2edd242b56a9ac30bb2910
3
  size 716569
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d64c7d6d395eda0007fbce75b2173da7e7906ca6099fd717677fbc77375710e4
3
  size 716569
tf_model.h5 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:77c05e3bb8424f04976b50f148ca43a9d8a2ba0cf3330c117424a88e2e5cf22f
3
+ size 905264
tokenizer.json CHANGED
@@ -935,340 +935,340 @@
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
- "##c": 790,
939
- "##r": 791,
940
- "##e": 792,
941
- "##a": 793,
942
- "##m": 794,
943
- "##i": 795,
944
  "##n": 796,
945
- "##g": 797,
946
- "##k": 798,
947
  "##p": 799,
948
- "##o": 800,
949
- "##t": 801,
950
- "##s": 802,
951
- "##l": 803,
952
- "##1": 804,
953
- "##h": 805,
954
- "##d": 806,
955
- "##j": 807,
956
- "##f": 808,
957
  "##y": 809,
958
- "##b": 810,
959
- "##u": 811,
960
- "##w": 812,
961
- "##v": 813,
962
- "##x": 814,
963
- "##5": 815,
964
- "##8": 816,
965
- "##3": 817,
966
- "##9": 818,
967
- "##7": 819,
968
- "##6": 820,
969
- "##z": 821,
970
- "##": 822,
971
- "##": 823,
972
- "##": 824,
973
- "##0": 825,
974
- "##": 826,
975
- "##": 827,
976
- "##": 828,
977
- "##4": 829,
978
- "##2": 830,
979
- "##": 831,
980
- "##": 832,
981
- "##": 833,
982
- "##": 834,
983
- "##q": 835,
984
- "##": 836,
985
- "##": 837,
986
- "##": 838,
987
- "##": 839,
988
- "##ɪ": 840,
989
- "##": 841,
990
- "##": 842,
991
- "##": 843,
992
- "##ø": 844,
993
- "##ł": 845,
994
- "##": 846,
995
- "##": 847,
996
- "##": 848,
997
- "##ʻ": 849,
998
- "##": 850,
999
- "##": 851,
1000
- "##": 852,
1001
- "##": 853,
1002
- "##л": 854,
1003
- "##а": 855,
1004
- "##α": 856,
1005
- "##ο": 857,
1006
- "##ς": 858,
1007
- "##": 859,
1008
- "##": 860,
1009
- "##δ": 861,
1010
- "##μ": 862,
1011
- "##ə": 863,
1012
- "##ː": 864,
1013
- "##ˈ": 865,
1014
- "##ɳ": 866,
1015
- "##т": 867,
1016
- "##е": 868,
1017
- "##д": 869,
1018
- "##р": 870,
1019
- "##": 871,
1020
- "##": 872,
1021
- "##ɔ": 873,
1022
- "##ɡ": 874,
1023
- "##ʃ": 875,
1024
- "##ɒ": 876,
1025
- "##": 877,
1026
- "##θ": 878,
1027
- "##ʊ": 879,
1028
- "##ъ": 880,
1029
- "##з": 881,
1030
- "##н": 882,
1031
- "##с": 883,
1032
- "##и": 884,
1033
- "##": 885,
1034
- "##": 886,
1035
- "##": 887,
1036
- "##ل": 888,
1037
- "##ا": 889,
1038
- "##د": 890,
1039
- "##ʁ": 891,
1040
- "##ו": 892,
1041
- "##פ": 893,
1042
- "##נ": 894,
1043
- "##ה": 895,
1044
- "##": 896,
1045
- "##": 897,
1046
- "##": 898,
1047
- "##": 899,
1048
- "##": 900,
1049
- "##ε": 901,
1050
  "##ρ": 902,
1051
- "##о": 903,
1052
- "##к": 904,
1053
- "##п": 905,
1054
- "##г": 906,
1055
- "##": 907,
1056
- "##ि": 908,
1057
- "##": 909,
1058
- "##": 910,
1059
- "##": 911,
1060
- "##": 912,
1061
- "##س": 913,
1062
- "##ت": 914,
1063
- "##ن": 915,
1064
- "##": 916,
1065
- "##ν": 917,
1066
- "##": 918,
1067
- "##": 919,
1068
- "##": 920,
1069
- "##": 921,
1070
- "##ي": 922,
1071
- "##ف": 923,
1072
- "##æ": 924,
1073
- "##ω": 925,
1074
- "##τ": 926,
1075
- "##ι": 927,
1076
- "##ɛ": 928,
1077
- "##": 929,
1078
- "##": 930,
1079
- "##ɑ": 931,
1080
- "##ɾ": 932,
1081
- "##": 933,
1082
- "##": 934,
1083
- "##": 935,
1084
- "##ش": 936,
1085
- "##خ": 937,
1086
- "##ɽ": 938,
1087
- "##η": 939,
1088
- "##": 940,
1089
- "##": 941,
1090
- "##": 942,
1091
- "##": 943,
1092
- "##": 944,
1093
- "##": 945,
1094
- "##": 946,
1095
- "##": 947,
1096
- "##": 948,
1097
- "##": 949,
1098
- "##": 950,
1099
- "##": 951,
1100
- "##": 952,
1101
- "##π": 953,
1102
- "##κ": 954,
1103
- "##λ": 955,
1104
- "##": 956,
1105
- "##": 957,
1106
- "##": 958,
1107
- "##": 959,
1108
- "##م": 960,
1109
- "##": 961,
1110
- "##": 962,
1111
- "##": 963,
1112
- "##": 964,
1113
- "##": 965,
1114
- "##": 966,
1115
- "##œ": 967,
1116
- "##υ": 968,
1117
- "##χ": 969,
1118
- "##": 970,
1119
- "##": 971,
1120
- "##": 972,
1121
- "##": 973,
1122
- "##": 974,
1123
- "##σ": 975,
1124
- "##": 976,
1125
- "##": 977,
1126
- "##": 978,
1127
- "##ص": 979,
1128
- "##": 980,
1129
- "##": 981,
1130
- "##ق": 982,
1131
- "##ܠ": 983,
1132
- "##ܗ": 984,
1133
- "##ܐ": 985,
1134
- "##ж": 986,
1135
- "##": 987,
1136
- "##": 988,
1137
- "##ы": 989,
1138
- "##в": 990,
1139
- "##ף": 991,
1140
- "##": 992,
1141
- "##": 993,
1142
- "##": 994,
1143
- "##ð": 995,
1144
- "##º": 996,
1145
- "##ß": 997,
1146
- "##": 998,
1147
- "##": 999,
1148
- "##": 1000,
1149
- "##ן": 1001,
1150
- "##": 1002,
1151
- "##м": 1003,
1152
- "##": 1004,
1153
- "##י": 1005,
1154
- "##ס": 1006,
1155
- "##ל": 1007,
1156
- "##đ": 1008,
1157
- "##": 1009,
1158
- "##": 1010,
1159
- "##ʔ": 1011,
1160
- "##ه": 1012,
1161
- "##ם": 1013,
1162
- "##ξ": 1014,
1163
- "##": 1015,
1164
- "##": 1016,
1165
- "##": 1017,
1166
- "##": 1018,
1167
- "##": 1019,
1168
- "##": 1020,
1169
- "##ʲ": 1021,
1170
- "##ב": 1022,
1171
- "##ר": 1023,
1172
- "##γ": 1024,
1173
- "##א": 1025,
1174
- "##": 1026,
1175
- "##": 1027,
1176
- "##ر": 1028,
1177
- "##ˌ": 1029,
1178
- "##ث": 1030,
1179
- "##": 1031,
1180
- "##": 1032,
1181
- "##": 1033,
1182
- "##": 1034,
1183
- "##": 1035,
1184
- "##": 1036,
1185
- "##": 1037,
1186
- "##": 1038,
1187
- "##ب": 1039,
1188
- "##": 1040,
1189
- "##": 1041,
1190
- "##ع": 1042,
1191
- "##ة": 1043,
1192
- "##": 1044,
1193
- "##ʿ": 1045,
1194
- "##ɐ": 1046,
1195
- "##ש": 1047,
1196
- "##מ": 1048,
1197
- "##צ": 1049,
1198
- "##ܕ": 1050,
1199
- "##ܝ": 1051,
1200
- "##ܢ": 1052,
1201
- "##ܬ": 1053,
1202
- "##": 1054,
1203
- "##": 1055,
1204
- "##": 1056,
1205
- "##ı": 1057,
1206
- "##ш": 1058,
1207
- "##": 1059,
1208
- "##я": 1060,
1209
- "##": 1061,
1210
- "##": 1062,
1211
- "##": 1063,
1212
- "##": 1064,
1213
- "##": 1065,
1214
- "##": 1066,
1215
- "##": 1067,
1216
- "##": 1068,
1217
- "##": 1069,
1218
- "##": 1070,
1219
- "##": 1071,
1220
- "##": 1072,
1221
- "##": 1073,
1222
- "##": 1074,
1223
- "##": 1075,
1224
- "##": 1076,
1225
- "##": 1077,
1226
- "##": 1078,
1227
- "##": 1079,
1228
- "##": 1080,
1229
- "##": 1081,
1230
- "##": 1082,
1231
- "##ك": 1083,
1232
- "##є": 1084,
1233
- "##ء": 1085,
1234
- "##": 1086,
1235
- "##": 1087,
1236
- "##": 1088,
1237
- "##": 1089,
1238
- "##у": 1090,
1239
- "##": 1091,
1240
- "##و": 1092,
1241
- "##": 1093,
1242
- "##": 1094,
1243
- "##х": 1095,
1244
- "##": 1096,
1245
- "##": 1097,
1246
- "##β": 1098,
1247
- "##ת": 1099,
1248
- "##ɜ": 1100,
1249
- "##ψ": 1101,
1250
- "##ю": 1102,
1251
- "##": 1103,
1252
- "##": 1104,
1253
- "##ц": 1105,
1254
- "##ь": 1106,
1255
- "##": 1107,
1256
- "##ɫ": 1108,
1257
- "##ذ": 1109,
1258
- "##": 1110,
1259
- "##": 1111,
1260
- "##ح": 1112,
1261
- "##": 1113,
1262
- "##": 1114,
1263
- "##ʒ": 1115,
1264
- "##": 1116,
1265
- "##": 1117,
1266
- "##": 1118,
1267
- "##": 1119,
1268
- "##": 1120,
1269
- "##": 1121,
1270
- "##": 1122,
1271
- "##": 1123
1272
  }
1273
  }
1274
  }
 
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
+ "##e": 790,
939
+ "##d": 791,
940
+ "##i": 792,
941
+ "##t": 793,
942
+ "##r": 794,
943
+ "##a": 795,
944
  "##n": 796,
945
+ "##c": 797,
946
+ "##s": 798,
947
  "##p": 799,
948
+ "##u": 800,
949
+ "##l": 801,
950
+ "##o": 802,
951
+ "##b": 803,
952
+ "##g": 804,
953
+ "##v": 805,
954
+ "##f": 806,
955
+ "##w": 807,
956
+ "##m": 808,
957
  "##y": 809,
958
+ "##h": 810,
959
+ "##1": 811,
960
+ "##k": 812,
961
+ "##7": 813,
962
+ "##2": 814,
963
+ "##8": 815,
964
+ "##x": 816,
965
+ "##z": 817,
966
+ "##q": 818,
967
+ "##3": 819,
968
+ "##9": 820,
969
+ "##5": 821,
970
+ "##4": 822,
971
+ "##ɜ": 823,
972
+ "##ː": 824,
973
+ "##j": 825,
974
+ "##0": 826,
975
+ "##6": 827,
976
+ "##": 828,
977
+ "##": 829,
978
+ "##": 830,
979
+ "##": 831,
980
+ "##": 832,
981
+ "##ν": 833,
982
+ "##θ": 834,
983
+ "##η": 835,
984
+ "##μ": 836,
985
+ "##ο": 837,
986
+ "##ι": 838,
987
+ "##ø": 839,
988
+ "##ł": 840,
989
+ "##ə": 841,
990
+ "##ɪ": 842,
991
+ "##ב": 843,
992
+ "##ת": 844,
993
+ "##א": 845,
994
+ "##י": 846,
995
+ "##": 847,
996
+ "##": 848,
997
+ "##": 849,
998
+ "##": 850,
999
+ "##": 851,
1000
+ "##": 852,
1001
+ "##": 853,
1002
+ "##ش": 854,
1003
+ "##م": 855,
1004
+ "##و": 856,
1005
+ "##ن": 857,
1006
+ "##æ": 858,
1007
+ "##ܠ": 859,
1008
+ "##ܗ": 860,
1009
+ "##ܐ": 861,
1010
+ "##β": 862,
1011
+ "##ʿ": 863,
1012
+ "##л": 864,
1013
+ "##а": 865,
1014
+ "##х": 866,
1015
+ "##ʊ": 867,
1016
+ "##ˌ": 868,
1017
+ "##ל": 869,
1018
+ "##ה": 870,
1019
+ "##ם": 871,
1020
+ "##ˈ": 872,
1021
+ "##ʻ": 873,
1022
+ "##": 874,
1023
+ "##": 875,
1024
+ "##ق": 876,
1025
+ "##ع": 877,
1026
+ "##د": 878,
1027
+ "##ɒ": 879,
1028
+ "##": 880,
1029
+ "##ɔ": 881,
1030
+ "##": 882,
1031
+ "##": 883,
1032
+ "##": 884,
1033
+ "##": 885,
1034
+ "##": 886,
1035
+ "##": 887,
1036
+ "##": 888,
1037
+ "##ε": 889,
1038
+ "##ς": 890,
1039
+ "##т": 891,
1040
+ "##р": 892,
1041
+ "##и": 893,
1042
+ "##ш": 894,
1043
+ "##е": 895,
1044
+ "##с": 896,
1045
+ "##к": 897,
1046
+ "##": 898,
1047
+ "##": 899,
1048
+ "##": 900,
1049
+ "##": 901,
1050
  "##ρ": 902,
1051
+ "##ξ": 903,
1052
+ "##": 904,
1053
+ "##ि": 905,
1054
+ "##": 906,
1055
+ "##δ": 907,
1056
+ "##ω": 908,
1057
+ "##đ": 909,
1058
+ "##τ": 910,
1059
+ "##": 911,
1060
+ "##": 912,
1061
+ "##": 913,
1062
+ "##": 914,
1063
+ "##": 915,
1064
+ "##ɑ": 916,
1065
+ "##ل": 917,
1066
+ "##ا": 918,
1067
+ "##ه": 919,
1068
+ "##ß": 920,
1069
+ "##": 921,
1070
+ "##": 922,
1071
+ "##": 923,
1072
+ "##ψ": 924,
1073
+ "##": 925,
1074
+ "##": 926,
1075
+ "##": 927,
1076
+ "##": 928,
1077
+ "##в": 929,
1078
+ "##з": 930,
1079
+ "##": 931,
1080
+ "##": 932,
1081
+ "##": 933,
1082
+ "##": 934,
1083
+ "##": 935,
1084
+ "##": 936,
1085
+ "##о": 937,
1086
+ "##я": 938,
1087
+ "##": 939,
1088
+ "##": 940,
1089
+ "##": 941,
1090
+ "##": 942,
1091
+ "##ذ": 943,
1092
+ "##ي": 944,
1093
+ "##ة": 945,
1094
+ "##": 946,
1095
+ "##": 947,
1096
+ "##ف": 948,
1097
+ "##": 949,
1098
+ "##": 950,
1099
+ "##": 951,
1100
+ "##": 952,
1101
+ "##": 953,
1102
+ "##": 954,
1103
+ "##": 955,
1104
+ "##": 956,
1105
+ "##": 957,
1106
+ "##": 958,
1107
+ "##": 959,
1108
+ "##": 960,
1109
+ "##": 961,
1110
+ "##ɡ": 962,
1111
+ "##ʃ": 963,
1112
+ "##": 964,
1113
+ "##": 965,
1114
+ "##": 966,
1115
+ "##": 967,
1116
+ "##": 968,
1117
+ "##": 969,
1118
+ "##": 970,
1119
+ "##ɛ": 971,
1120
+ "##س": 972,
1121
+ "##ت": 973,
1122
+ "##α": 974,
1123
+ "##κ": 975,
1124
+ "##": 976,
1125
+ "##": 977,
1126
+ "##ب": 978,
1127
+ "##γ": 979,
1128
+ "##ן": 980,
1129
+ "##": 981,
1130
+ "##": 982,
1131
+ "##": 983,
1132
+ "##خ": 984,
1133
+ "##": 985,
1134
+ "##ı": 986,
1135
+ "##": 987,
1136
+ "##ء": 988,
1137
+ "##ъ": 989,
1138
+ "##": 990,
1139
+ "##": 991,
1140
+ "##": 992,
1141
+ "##ر": 993,
1142
+ "##д": 994,
1143
+ "##ж": 995,
1144
+ "##λ": 996,
1145
+ "##": 997,
1146
+ "##": 998,
1147
+ "##": 999,
1148
+ "##": 1000,
1149
+ "##": 1001,
1150
+ "##ح": 1002,
1151
+ "##": 1003,
1152
+ "##": 1004,
1153
+ "##": 1005,
1154
+ "##": 1006,
1155
+ "##ю": 1007,
1156
+ "##": 1008,
1157
+ "##": 1009,
1158
+ "##χ": 1010,
1159
+ "##": 1011,
1160
+ "##פ": 1012,
1161
+ "##": 1013,
1162
+ "##": 1014,
1163
+ "##": 1015,
1164
+ "##ك": 1016,
1165
+ "##ʁ": 1017,
1166
+ "##υ": 1018,
1167
+ "##": 1019,
1168
+ "##": 1020,
1169
+ "##": 1021,
1170
+ "##": 1022,
1171
+ "##": 1023,
1172
+ "##ث": 1024,
1173
+ "##": 1025,
1174
+ "##º": 1026,
1175
+ "##": 1027,
1176
+ "##": 1028,
1177
+ "##п": 1029,
1178
+ "##н": 1030,
1179
+ "##г": 1031,
1180
+ "##ɐ": 1032,
1181
+ "##ы": 1033,
1182
+ "##ɽ": 1034,
1183
+ "##": 1035,
1184
+ "##π": 1036,
1185
+ "##ɫ": 1037,
1186
+ "##ʔ": 1038,
1187
+ "##": 1039,
1188
+ "##": 1040,
1189
+ "##": 1041,
1190
+ "##": 1042,
1191
+ "##": 1043,
1192
+ "##": 1044,
1193
+ "##": 1045,
1194
+ "##": 1046,
1195
+ "##": 1047,
1196
+ "##": 1048,
1197
+ "##": 1049,
1198
+ "##ו": 1050,
1199
+ "##ð": 1051,
1200
+ "##": 1052,
1201
+ "##": 1053,
1202
+ "##ס": 1054,
1203
+ "##": 1055,
1204
+ "##": 1056,
1205
+ "##": 1057,
1206
+ "##": 1058,
1207
+ "##": 1059,
1208
+ "##": 1060,
1209
+ "##ף": 1061,
1210
+ "##": 1062,
1211
+ "##": 1063,
1212
+ "##є": 1064,
1213
+ "##": 1065,
1214
+ "##": 1066,
1215
+ "##": 1067,
1216
+ "##": 1068,
1217
+ "##у": 1069,
1218
+ "##ש": 1070,
1219
+ "##מ": 1071,
1220
+ "##צ": 1072,
1221
+ "##ܕ": 1073,
1222
+ "##ܝ": 1074,
1223
+ "##ܢ": 1075,
1224
+ "##ܬ": 1076,
1225
+ "##": 1077,
1226
+ "##נ": 1078,
1227
+ "##": 1079,
1228
+ "##": 1080,
1229
+ "##": 1081,
1230
+ "##ɾ": 1082,
1231
+ "##ɳ": 1083,
1232
+ "##σ": 1084,
1233
+ "##ص": 1085,
1234
+ "##ц": 1086,
1235
+ "##ь": 1087,
1236
+ "##": 1088,
1237
+ "##": 1089,
1238
+ "##": 1090,
1239
+ "##": 1091,
1240
+ "##": 1092,
1241
+ "##": 1093,
1242
+ "##": 1094,
1243
+ "##": 1095,
1244
+ "##": 1096,
1245
+ "##": 1097,
1246
+ "##": 1098,
1247
+ "##": 1099,
1248
+ "##": 1100,
1249
+ "##": 1101,
1250
+ "##": 1102,
1251
+ "##ʲ": 1103,
1252
+ "##": 1104,
1253
+ "##": 1105,
1254
+ "##": 1106,
1255
+ "##": 1107,
1256
+ "##": 1108,
1257
+ "##": 1109,
1258
+ "##": 1110,
1259
+ "##": 1111,
1260
+ "##": 1112,
1261
+ "##ʒ": 1113,
1262
+ "##": 1114,
1263
+ "##": 1115,
1264
+ "##": 1116,
1265
+ "##": 1117,
1266
+ "##": 1118,
1267
+ "##м": 1119,
1268
+ "##": 1120,
1269
+ "##ר": 1121,
1270
+ "##œ": 1122,
1271
+ "##": 1123
1272
  }
1273
  }
1274
  }
tokenizer_config.json CHANGED
@@ -1,10 +1,10 @@
1
  {
 
2
  "cls_token": "[CLS]",
3
  "do_basic_tokenize": true,
4
  "do_lower_case": true,
5
  "mask_token": "[MASK]",
6
  "model_max_length": 512,
7
- "name_or_path": "/tmp/tmpwmqhff1f/decoder/processors",
8
  "never_split": null,
9
  "pad_token": "[PAD]",
10
  "sep_token": "[SEP]",
 
1
  {
2
+ "clean_up_tokenization_spaces": true,
3
  "cls_token": "[CLS]",
4
  "do_basic_tokenize": true,
5
  "do_lower_case": true,
6
  "mask_token": "[MASK]",
7
  "model_max_length": 512,
 
8
  "never_split": null,
9
  "pad_token": "[PAD]",
10
  "sep_token": "[SEP]",
vocab.txt CHANGED
@@ -788,263 +788,286 @@ z
788
 
789
 
790
 
791
- ##c
792
- ##r
793
  ##e
794
- ##a
795
- ##m
796
  ##i
797
- ##n
798
- ##g
799
- ##k
800
- ##p
801
- ##o
802
  ##t
 
 
 
 
803
  ##s
 
 
804
  ##l
805
- ##1
806
- ##h
807
- ##d
808
- ##j
809
- ##f
810
- ##y
811
  ##b
812
- ##u
813
- ##w
814
  ##v
815
- ##x
816
- ##5
 
 
 
 
 
 
 
817
  ##8
 
 
 
818
  ##3
819
  ##9
820
- ##7
821
- ##6
822
- ##z
823
- ##た
824
- ##め
825
- ##の
826
- ##0
827
- ##ा
828
- ##न
829
- ##ई
830
  ##4
831
- ##2
832
- ##
833
- ##
 
 
 
 
 
 
834
  ##ი
835
- ##
836
- ##q
837
- ##
838
- ##
839
- ##
840
- ##
841
- ##ɪ
842
- ##ォ
843
- ##ル
844
- ##テ
845
  ##ø
846
  ##ł
847
- ##
848
- ##
849
- ##
850
- ##ʻ
851
- ##
852
- ##
853
- ##
854
- ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
855
  ##л
856
  ##а
857
- ##α
858
- ##ο
859
- ##ς
860
- ##
861
- ##
862
- ##δ
863
- ##μ
864
- ##ə
865
- ##ː
866
  ##ˈ
867
- ##ɳ
868
- ##т
869
- ##е
870
- ##д
871
- ##р
872
- ##
873
- ##ネ
874
- ##ɔ
875
- ##ɡ
876
- ##ʃ
877
  ##ɒ
878
  ##ᵻ
879
- ##θ
880
- ##ʊ
881
- ##ъ
882
- ##з
883
- ##н
884
- ##с
 
 
 
 
 
 
885
  ##и
886
- ##
887
- ##
888
- ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
889
  ##ل
890
  ##ا
891
- ##د
892
- ##ʁ
893
- ##ו
894
- ##פ
895
- ##נ
896
- ##ה
897
- ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
898
  ##ち
899
  ##ゃ
900
  ##ん
901
- ##
902
- ##ε
903
- ##ρ
904
- ##о
905
- ##к
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
906
  ##п
 
907
  ##г
908
- ##
909
- ##ि
910
- ##ग
911
- ##გ
912
- ##ა
913
- ##ლ
914
- ##س
915
- ##ت
916
- ##ن
917
- ##す
918
- ##ν
919
- ##ラ
920
- ##ッ
921
- ##シ
922
- ##ュ
923
- ##ي
924
- ##ف
925
- ##æ
926
- ##ω
927
- ##τ
928
- ##ι
929
- ##ɛ
930
- ##ჲ
931
- ##ც
932
- ##ɑ
933
- ##ɾ
934
- ##ล
935
- ##อ
936
- ##ฮ
937
- ##ش
938
- ##خ
939
  ##ɽ
940
- ##η
941
- ##ら
942
- ##ტ
943
- ##ე
944
  ##あ
945
- ##ნ
946
- ##な
947
- ##ჱ
948
- ##ト
949
- ##ゥ
950
- ##ナ
951
- ##ー
952
- ##დ
953
- ##ქ
954
  ##π
955
- ##κ
956
- ##λ
957
- ##わ
958
- ##レ
959
- ##イ
960
- ##ン
961
- ##م
962
- ##れ
963
- ##ウ
964
- ##ァ
965
- ##キ
966
- ##3
967
- ##क
968
- ##œ
969
- ##υ
970
- ##χ
971
- ##フ
972
- ##เ
973
- ##ป
974
- ##ย
975
- ##タ
976
- ##σ
977
- ##ก
978
- ##ว
979
  ##ร
980
- ##ص
981
- ##ニ
982
- ##र
983
- ##ق
984
- ##ܠ
985
- ##ܗ
986
- ##ܐ
987
- ##ж
988
- ##ゆ
989
- ##り
990
- ##ы
991
- ##в
992
- ##ף
993
- ##か
994
- ##ह
995
  ##く
996
- ##ð
997
- ##º
998
- ##ß
999
- ##
1000
- ##
1001
- ##ィ
1002
- ##ן
1003
- ##ク
1004
- ##м
1005
- ##ハ
1006
- ##י
1007
- ##ס
1008
- ##ל
1009
- ##đ
1010
- ##მ
1011
- ##ซ
1012
- ##ʔ
1013
- ##ه
1014
- ##ם
1015
- ##ξ
1016
- ##แ
1017
- ##ョ
1018
- ##こ
1019
  ##ム
1020
  ##チ
1021
  ##ェ
1022
- ##ʲ
1023
- ##ב
1024
- ##ר
1025
- ##γ
1026
- ##א
1027
- ##
1028
- ##
1029
- ##ر
1030
- ##ˌ
1031
- ##ث
1032
- ##
1033
- ##
1034
  ##წ
1035
  ##ფ
1036
- ##
1037
- ##
1038
- ##
1039
- ##
1040
- ##ب
1041
- ##
1042
- ##サ
1043
- ##ع
1044
- ##ة
1045
- ##カ
1046
- ##ʿ
1047
- ##ɐ
1048
  ##ש
1049
  ##מ
1050
  ##צ
@@ -1052,73 +1075,50 @@ z
1052
  ##ܝ
1053
  ##ܢ
1054
  ##ܬ
1055
- ##
1056
- ##
1057
- ##
1058
- ##ı
1059
- ##ш
1060
- ##
1061
- ##я
1062
- ##
1063
- ##
1064
- ##
1065
- ##
1066
- ##エ
1067
- ##ค
1068
- ##も
1069
  ##ᅦ
1070
- ##ᄃ
1071
  ##ᅩ
1072
  ##ᆨ
1073
- ##ᄅ
1074
  ##ᅵ
1075
  ##ᆸ
1076
- ##ᄇ
1077
  ##ᅧ
1078
  ##ᆼ
1079
  ##ᄋ
1080
  ##ᆫ
1081
- ##
1082
- ##
1083
- ##
1084
- ##ك
1085
- ##є
1086
- ##ء
1087
- ##
1088
- ##
 
 
 
 
 
 
 
 
 
1089
  ##ょ
1090
  ##に
1091
- ##у
1092
- ##
1093
- ##و
1094
- ##
1095
- ##ਹ
1096
- ##х
1097
- ##ᅡ
1098
- ##ᆯ
1099
- ##β
1100
- ##ת
1101
- ##ɜ
1102
- ##ψ
1103
- ##ю
1104
- ##ാ
1105
- ##ഹ
1106
- ##ц
1107
- ##ь
1108
- ##ᅮ
1109
- ##ɫ
1110
- ##ذ
1111
- ##セ
1112
- ##オ
1113
- ##ح
1114
- ##ひ
1115
  ##を
1116
- ##ʒ
1117
- ##
1118
- ##
1119
- ##ษ
1120
- ##ฐ
1121
- ##ल
1122
- ##ਾ
1123
- ##ミ
1124
- ##ノ
 
788
 
789
 
790
 
 
 
791
  ##e
792
+ ##d
 
793
  ##i
 
 
 
 
 
794
  ##t
795
+ ##r
796
+ ##a
797
+ ##n
798
+ ##c
799
  ##s
800
+ ##p
801
+ ##u
802
  ##l
803
+ ##o
 
 
 
 
 
804
  ##b
805
+ ##g
 
806
  ##v
807
+ ##f
808
+ ##w
809
+ ##m
810
+ ##y
811
+ ##h
812
+ ##1
813
+ ##k
814
+ ##7
815
+ ##2
816
  ##8
817
+ ##x
818
+ ##z
819
+ ##q
820
  ##3
821
  ##9
822
+ ##5
 
 
 
 
 
 
 
 
 
823
  ##4
824
+ ##ɜ
825
+ ##ː
826
+ ##j
827
+ ##0
828
+ ##6
829
+ ##ო
830
+ ##მ
831
+ ##ე
832
+ ##ლ
833
  ##ი
834
+ ##ν
835
+ ##θ
836
+ ##η
837
+ ##μ
838
+ ##ο
839
+ ##ι
 
 
 
 
840
  ##ø
841
  ##ł
842
+ ##ə
843
+ ##ɪ
844
+ ##ב
845
+ ##ת
846
+ ##א
847
+ ##י
848
+ ##
849
+ ##
850
+ ##ン
851
+ ##ス
852
+ ##フ
853
+ ##ー
854
+ ##ル
855
+ ##ش
856
+ ##م
857
+ ##و
858
+ ##ن
859
+ ##æ
860
+ ##ܠ
861
+ ##ܗ
862
+ ##ܐ
863
+ ##β
864
+ ##ʿ
865
  ##л
866
  ##а
867
+ ##х
868
+ ##ʊ
869
+ ##ˌ
870
+ ##ל
871
+ ##ה
872
+ ##ם
 
 
 
873
  ##ˈ
874
+ ##ʻ
875
+ ##
876
+ ##
877
+ ##ق
878
+ ##ع
879
+ ##د
 
 
 
 
880
  ##ɒ
881
  ##ᵻ
882
+ ##ɔ
883
+ ##
884
+ ##
885
+ ##
886
+ ##
887
+ ##
888
+ ##ण
889
+ ##ई
890
+ ##ε
891
+ ##ς
892
+ ##т
893
+ ##р
894
  ##и
895
+ ##ш
896
+ ##е
897
+ ##с
898
+ ##к
899
+ ##ク
900
+ ##サ
901
+ ##व
902
+ ##द
903
+ ##ρ
904
+ ##ξ
905
+ ##ह
906
+ ##ि
907
+ ##क
908
+ ##δ
909
+ ##ω
910
+ ##đ
911
+ ##τ
912
+ ##რ
913
+ ##გ
914
+ ##ვ
915
+ ##ა
916
+ ##ნ
917
+ ##ɑ
918
  ##ل
919
  ##ا
920
+ ##ه
921
+ ##ß
922
+ ##
923
+ ##
924
+ ##
925
+ ##ψ
926
+ ##
927
+ ##ᅮ
928
+ ##ᄃ
929
+ ##ᅢ
930
+ ##в
931
+ ##з
932
+ ##ᅡ
933
+ ##ᆯ
934
+ ##ᄅ
935
+ ##の
936
+ ##な
937
+ ##ら
938
+ ##о
939
+ ##я
940
+ ##る
941
  ##ち
942
  ##ゃ
943
  ##ん
944
+ ##ذ
945
+ ##ي
946
+ ##ة
947
+ ##
948
+ ##
949
+ ##ف
950
+ ##ล
951
+ ##อ
952
+ ##ฮ
953
+ ##は
954
+ ##り
955
+ ##っ
956
+ ##ュ
957
+ ##ナ
958
+ ##ミ
959
+ ##แ
960
+ ##ก
961
+ ##ป
962
+ ##ย
963
+ ##ɡ
964
+ ##ʃ
965
+ ##た
966
+ ##す
967
+ ##き
968
+ ##ひ
969
+ ##と
970
+ ##ハ
971
+ ##ト
972
+ ##ɛ
973
+ ##س
974
+ ##ت
975
+ ##α
976
+ ##κ
977
+ ##ს
978
+ ##უ
979
+ ##ب
980
+ ##γ
981
+ ##ן
982
+ ##ტ
983
+ ##ჲ
984
+ ##ც
985
+ ##خ
986
+ ##わ
987
+ ##ı
988
+ ##ল
989
+ ##ء
990
+ ##ъ
991
+ ##ラ
992
+ ##か
993
+ ##う
994
+ ##ر
995
+ ##д
996
+ ##ж
997
+ ##λ
998
+ ##न
999
+ ##พ
1000
+ ##め
1001
+ ##ッ
1002
+ ##シ
1003
+ ##ح
1004
+ ##も
1005
+ ##ल
1006
+ ##ノ
1007
+ ##ხ
1008
+ ##ю
1009
+ ##つ
1010
+ ##せ
1011
+ ##χ
1012
+ ##こ
1013
+ ##פ
1014
+ ##ჱ
1015
+ ##ാ
1016
+ ##ഹ
1017
+ ##ك
1018
+ ##ʁ
1019
+ ##υ
1020
+ ##ਲ
1021
+ ##ਹ
1022
+ ##ニ
1023
+ ##ア
1024
+ ##タ
1025
+ ##ث
1026
+ ##เ
1027
+ ##º
1028
+ ##स
1029
+ ##レ
1030
  ##п
1031
+ ##н
1032
  ##г
1033
+ ##ɐ
1034
+ ##ы
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1035
  ##ɽ
 
 
 
 
1036
  ##あ
 
 
 
 
 
 
 
 
 
1037
  ##π
1038
+ ##ɫ
1039
+ ##ʔ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1040
  ##ร
1041
+ ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1042
  ##く
1043
+ ##
1044
+ ##
1045
+ ##
1046
+ ##
1047
+ ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1048
  ##ム
1049
  ##チ
1050
  ##ェ
1051
+ ##ו
1052
+ ##ð
1053
+ ##
1054
+ ##
1055
+ ##ס
1056
+ ##
1057
+ ##
1058
+ ##
1059
+ ##
1060
+ ##
1061
+ ##
1062
+ ##ף
1063
  ##წ
1064
  ##ფ
1065
+ ##є
1066
+ ##
1067
+ ##
1068
+ ##
1069
+ ##
1070
+ ##у
 
 
 
 
 
 
1071
  ##ש
1072
  ##מ
1073
  ##צ
 
1075
  ##ܝ
1076
  ##ܢ
1077
  ##ܬ
1078
+ ##
1079
+ ##נ
1080
+ ##
1081
+ ##
1082
+ ##
1083
+ ##ɾ
1084
+ ##ɳ
1085
+ ##σ
1086
+ ##ص
1087
+ ##ц
1088
+ ##ь
 
 
 
1089
  ##ᅦ
 
1090
  ##ᅩ
1091
  ##ᆨ
 
1092
  ##ᅵ
1093
  ##ᆸ
 
1094
  ##ᅧ
1095
  ##ᆼ
1096
  ##ᄋ
1097
  ##ᆫ
1098
+ ##
1099
+ ##
1100
+ ##
1101
+ ##
1102
+ ##
1103
+ ##
1104
+ ##ʲ
1105
+ ##
1106
+ ##ฐ
1107
+ ##დ
1108
+ ##ณ
1109
+ ##ม
1110
+ ##ต
1111
+ ##ツ
1112
+ ##ქ
1113
+ ##マ
1114
+ ##ʒ
1115
  ##ょ
1116
  ##に
1117
+ ##
1118
+ ##
1119
+ ##
1120
+ ##м
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1121
  ##を
1122
+ ##ר
1123
+ ##œ
1124
+ ##