Update tiny models for VisionTextDualEncoderModel-vit-bert

#20
Files changed (7) hide show
  1. config.json +5 -4
  2. preprocessor_config.json +1 -1
  3. pytorch_model.bin +1 -1
  4. tf_model.h5 +3 -0
  5. tokenizer.json +331 -331
  6. tokenizer_config.json +1 -1
  7. vocab.txt +270 -270
config.json CHANGED
@@ -1,5 +1,6 @@
1
  {
2
  "_commit_hash": null,
 
3
  "architectures": [
4
  "VisionTextDualEncoderModel"
5
  ],
@@ -7,7 +8,7 @@
7
  "model_type": "vision-text-dual-encoder",
8
  "projection_dim": 512,
9
  "text_config": {
10
- "_name_or_path": "/tmp/tmpwmqhff1f/decoder/BertModel",
11
  "add_cross_attention": false,
12
  "architectures": [
13
  "BertModel"
@@ -80,7 +81,7 @@
80
  "top_p": 1.0,
81
  "torch_dtype": "float32",
82
  "torchscript": false,
83
- "transformers_version": "4.25.0.dev0",
84
  "type_vocab_size": 16,
85
  "typical_p": 1.0,
86
  "use_bfloat16": false,
@@ -90,7 +91,7 @@
90
  "torch_dtype": "float32",
91
  "transformers_version": null,
92
  "vision_config": {
93
- "_name_or_path": "/tmp/tmpwmqhff1f/encoder/ViTModel",
94
  "add_cross_attention": false,
95
  "architectures": [
96
  "ViTModel"
@@ -165,7 +166,7 @@
165
  "top_p": 1.0,
166
  "torch_dtype": "float32",
167
  "torchscript": false,
168
- "transformers_version": "4.25.0.dev0",
169
  "typical_p": 1.0,
170
  "use_bfloat16": false
171
  }
 
1
  {
2
  "_commit_hash": null,
3
+ "_name_or_path": "tiny_models/vision-text-dual-encoder/VisionTextDualEncoderModel-vit-bert",
4
  "architectures": [
5
  "VisionTextDualEncoderModel"
6
  ],
 
8
  "model_type": "vision-text-dual-encoder",
9
  "projection_dim": 512,
10
  "text_config": {
11
+ "_name_or_path": "/tmp/tmpbgs85kmg/decoder/BertModel",
12
  "add_cross_attention": false,
13
  "architectures": [
14
  "BertModel"
 
81
  "top_p": 1.0,
82
  "torch_dtype": "float32",
83
  "torchscript": false,
84
+ "transformers_version": "4.28.0.dev0",
85
  "type_vocab_size": 16,
86
  "typical_p": 1.0,
87
  "use_bfloat16": false,
 
91
  "torch_dtype": "float32",
92
  "transformers_version": null,
93
  "vision_config": {
94
+ "_name_or_path": "/tmp/tmpbgs85kmg/encoder/ViTModel",
95
  "add_cross_attention": false,
96
  "architectures": [
97
  "ViTModel"
 
166
  "top_p": 1.0,
167
  "torch_dtype": "float32",
168
  "torchscript": false,
169
+ "transformers_version": "4.28.0.dev0",
170
  "typical_p": 1.0,
171
  "use_bfloat16": false
172
  }
preprocessor_config.json CHANGED
@@ -8,7 +8,7 @@
8
  0.5,
9
  0.5
10
  ],
11
- "image_processor_type": "ViTImageProcessor",
12
  "image_std": [
13
  0.5,
14
  0.5,
 
8
  0.5,
9
  0.5
10
  ],
11
+ "image_processor_type": "ViTFeatureExtractor",
12
  "image_std": [
13
  0.5,
14
  0.5,
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:3fb46eeeef53c003470020f7534b354d9d97f6195f2edd242b56a9ac30bb2910
3
  size 716569
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:3fc2fc830fa4644c8885476cc74270e25f494e6c317680ce3ddfedbf49440f7e
3
  size 716569
tf_model.h5 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:823bc6a35553dfc9a9e401aa807c7c50e2d573dfa90a168dd74228f728473f51
3
+ size 905264
tokenizer.json CHANGED
@@ -935,340 +935,340 @@
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
- "##c": 790,
939
- "##r": 791,
940
- "##e": 792,
941
- "##a": 793,
942
- "##m": 794,
943
- "##i": 795,
944
- "##n": 796,
945
- "##g": 797,
946
- "##k": 798,
947
- "##p": 799,
948
- "##o": 800,
949
- "##t": 801,
950
- "##s": 802,
951
- "##l": 803,
952
- "##1": 804,
953
- "##h": 805,
954
- "##d": 806,
955
- "##j": 807,
956
- "##f": 808,
957
- "##y": 809,
958
- "##b": 810,
959
- "##u": 811,
960
- "##w": 812,
961
- "##v": 813,
962
- "##x": 814,
963
- "##5": 815,
964
- "##8": 816,
965
- "##3": 817,
966
- "##9": 818,
967
- "##7": 819,
968
- "##6": 820,
969
- "##z": 821,
970
- "##": 822,
971
- "##": 823,
972
- "##": 824,
973
- "##0": 825,
974
- "##": 826,
975
- "##": 827,
976
- "##": 828,
977
- "##4": 829,
978
- "##2": 830,
979
- "##": 831,
980
- "##": 832,
981
- "##": 833,
982
- "##": 834,
983
- "##q": 835,
984
- "##": 836,
985
- "##": 837,
986
- "##": 838,
987
- "##": 839,
988
- "##ɪ": 840,
989
- "##": 841,
990
- "##": 842,
991
- "##": 843,
992
- "##ø": 844,
993
- "##ł": 845,
994
- "##": 846,
995
- "##": 847,
996
- "##": 848,
997
- "##ʻ": 849,
998
- "##": 850,
999
- "##": 851,
1000
- "##": 852,
1001
- "##": 853,
1002
- "##л": 854,
1003
- "##а": 855,
1004
- "##α": 856,
1005
- "##ο": 857,
1006
- "##ς": 858,
1007
- "##": 859,
1008
- "##": 860,
1009
- "##δ": 861,
1010
- "##μ": 862,
1011
- "##ə": 863,
1012
- "##ː": 864,
1013
- "##ˈ": 865,
1014
- "##ɳ": 866,
1015
- "##т": 867,
1016
- "##е": 868,
1017
- "##д": 869,
1018
- "##р": 870,
1019
- "##": 871,
1020
- "##": 872,
1021
- "##ɔ": 873,
1022
- "##ɡ": 874,
1023
- "##ʃ": 875,
1024
- "##ɒ": 876,
1025
- "##": 877,
1026
- "##θ": 878,
1027
- "##ʊ": 879,
1028
- "##ъ": 880,
1029
- "##з": 881,
1030
- "##н": 882,
1031
- "##с": 883,
1032
- "##и": 884,
1033
- "##": 885,
1034
- "##": 886,
1035
- "##": 887,
1036
- "##ل": 888,
1037
- "##ا": 889,
1038
- "##د": 890,
1039
- "##ʁ": 891,
1040
- "##ו": 892,
1041
- "##פ": 893,
1042
- "##נ": 894,
1043
- "##ה": 895,
1044
- "##": 896,
1045
- "##": 897,
1046
- "##": 898,
1047
- "##": 899,
1048
- "##": 900,
1049
- "##ε": 901,
1050
- "##ρ": 902,
1051
- "##о": 903,
1052
- "##к": 904,
1053
- "##п": 905,
1054
- "##г": 906,
1055
- "##": 907,
1056
- "##ि": 908,
1057
- "##": 909,
1058
- "##": 910,
1059
- "##": 911,
1060
- "##": 912,
1061
- "##س": 913,
1062
- "##ت": 914,
1063
- "##ن": 915,
1064
- "##": 916,
1065
- "##ν": 917,
1066
- "##": 918,
1067
- "##": 919,
1068
- "##": 920,
1069
- "##": 921,
1070
- "##ي": 922,
1071
- "##ف": 923,
1072
- "##æ": 924,
1073
- "##ω": 925,
1074
- "##τ": 926,
1075
- "##ι": 927,
1076
- "##ɛ": 928,
1077
- "##": 929,
1078
- "##": 930,
1079
- "##ɑ": 931,
1080
- "##ɾ": 932,
1081
- "##": 933,
1082
- "##": 934,
1083
- "##": 935,
1084
- "##ش": 936,
1085
- "##خ": 937,
1086
- "##ɽ": 938,
1087
- "##η": 939,
1088
- "##": 940,
1089
- "##": 941,
1090
- "##": 942,
1091
- "##": 943,
1092
- "##": 944,
1093
- "##": 945,
1094
- "##": 946,
1095
- "##": 947,
1096
- "##": 948,
1097
- "##": 949,
1098
- "##": 950,
1099
- "##": 951,
1100
- "##": 952,
1101
- "##π": 953,
1102
- "##κ": 954,
1103
- "##λ": 955,
1104
- "##": 956,
1105
- "##": 957,
1106
- "##": 958,
1107
- "##": 959,
1108
- "##م": 960,
1109
- "##": 961,
1110
- "##": 962,
1111
- "##": 963,
1112
- "##": 964,
1113
- "##": 965,
1114
- "##": 966,
1115
- "##œ": 967,
1116
- "##υ": 968,
1117
- "##χ": 969,
1118
- "##": 970,
1119
- "##": 971,
1120
- "##": 972,
1121
- "##": 973,
1122
- "##": 974,
1123
- "##σ": 975,
1124
- "##": 976,
1125
- "##": 977,
1126
- "##": 978,
1127
- "##ص": 979,
1128
- "##": 980,
1129
- "##": 981,
1130
- "##ق": 982,
1131
- "##ܠ": 983,
1132
- "##ܗ": 984,
1133
- "##ܐ": 985,
1134
- "##ж": 986,
1135
- "##": 987,
1136
- "##": 988,
1137
- "##ы": 989,
1138
- "##в": 990,
1139
- "##ף": 991,
1140
- "##": 992,
1141
- "##": 993,
1142
- "##": 994,
1143
- "##ð": 995,
1144
- "##º": 996,
1145
- "##ß": 997,
1146
- "##": 998,
1147
- "##": 999,
1148
- "##": 1000,
1149
- "##ן": 1001,
1150
- "##": 1002,
1151
- "##м": 1003,
1152
- "##": 1004,
1153
- "##י": 1005,
1154
- "##ס": 1006,
1155
- "##ל": 1007,
1156
- "##đ": 1008,
1157
- "##": 1009,
1158
- "##": 1010,
1159
- "##ʔ": 1011,
1160
- "##ه": 1012,
1161
- "##ם": 1013,
1162
- "##ξ": 1014,
1163
- "##": 1015,
1164
- "##": 1016,
1165
- "##": 1017,
1166
- "##": 1018,
1167
- "##": 1019,
1168
- "##": 1020,
1169
- "##ʲ": 1021,
1170
- "##ב": 1022,
1171
- "##ר": 1023,
1172
- "##γ": 1024,
1173
- "##א": 1025,
1174
- "##": 1026,
1175
- "##": 1027,
1176
- "##ر": 1028,
1177
- "##ˌ": 1029,
1178
- "##ث": 1030,
1179
- "##": 1031,
1180
- "##": 1032,
1181
- "##": 1033,
1182
- "##": 1034,
1183
- "##": 1035,
1184
- "##": 1036,
1185
- "##": 1037,
1186
- "##": 1038,
1187
- "##ب": 1039,
1188
- "##": 1040,
1189
- "##": 1041,
1190
- "##ع": 1042,
1191
- "##ة": 1043,
1192
- "##": 1044,
1193
- "##ʿ": 1045,
1194
- "##ɐ": 1046,
1195
- "##ש": 1047,
1196
- "##מ": 1048,
1197
- "##צ": 1049,
1198
- "##ܕ": 1050,
1199
- "##ܝ": 1051,
1200
- "##ܢ": 1052,
1201
- "##ܬ": 1053,
1202
- "##": 1054,
1203
- "##": 1055,
1204
- "##": 1056,
1205
- "##ı": 1057,
1206
- "##ш": 1058,
1207
- "##": 1059,
1208
- "##я": 1060,
1209
- "##": 1061,
1210
  "##ะ": 1062,
1211
  "##ช": 1063,
1212
  "##น": 1064,
1213
- "##": 1065,
1214
- "##": 1066,
1215
- "##": 1067,
1216
- "##": 1068,
1217
- "##": 1069,
1218
- "##": 1070,
1219
- "##": 1071,
1220
- "##": 1072,
1221
- "##": 1073,
1222
- "##": 1074,
1223
- "##": 1075,
1224
- "##": 1076,
1225
- "##": 1077,
1226
- "##": 1078,
1227
- "##": 1079,
1228
- "##": 1080,
1229
- "##": 1081,
1230
- "##": 1082,
1231
- "##ك": 1083,
1232
- "##є": 1084,
1233
- "##ء": 1085,
1234
- "##": 1086,
1235
- "##": 1087,
1236
- "##": 1088,
1237
- "##": 1089,
1238
- "##у": 1090,
1239
- "##": 1091,
1240
- "##و": 1092,
1241
- "##": 1093,
1242
- "##": 1094,
1243
- "##х": 1095,
1244
- "##": 1096,
1245
- "##": 1097,
1246
- "##β": 1098,
1247
- "##ת": 1099,
1248
- "##ɜ": 1100,
1249
- "##ψ": 1101,
1250
- "##ю": 1102,
1251
- "##": 1103,
1252
- "##": 1104,
1253
- "##ц": 1105,
1254
- "##ь": 1106,
1255
- "##": 1107,
1256
- "##ɫ": 1108,
1257
- "##ذ": 1109,
1258
- "##": 1110,
1259
- "##": 1111,
1260
- "##ح": 1112,
1261
- "##": 1113,
1262
- "##": 1114,
1263
- "##ʒ": 1115,
1264
- "##": 1116,
1265
- "##": 1117,
1266
- "##": 1118,
1267
- "##": 1119,
1268
- "##": 1120,
1269
- "##": 1121,
1270
- "##": 1122,
1271
- "##": 1123
1272
  }
1273
  }
1274
  }
 
935
  "/": 787,
936
  "3": 788,
937
  "~": 789,
938
+ "##r": 790,
939
+ "##a": 791,
940
+ "##i": 792,
941
+ "##n": 793,
942
+ "##o": 794,
943
+ "##s": 795,
944
+ "##t": 796,
945
+ "##e": 797,
946
+ "##u": 798,
947
+ "##l": 799,
948
+ "##1": 800,
949
+ "##4": 801,
950
+ "##8": 802,
951
+ "##7": 803,
952
+ "##m": 804,
953
+ "##g": 805,
954
+ "##p": 806,
955
+ "##h": 807,
956
+ "##b": 808,
957
+ "##z": 809,
958
+ "##2": 810,
959
+ "##5": 811,
960
+ "##0": 812,
961
+ "##w": 813,
962
+ "##f": 814,
963
+ "##d": 815,
964
+ "##j": 816,
965
+ "##c": 817,
966
+ "##y": 818,
967
+ "##v": 819,
968
+ "##k": 820,
969
+ "##x": 821,
970
+ "##6": 822,
971
+ "##q": 823,
972
+ "##9": 824,
973
+ "##3": 825,
974
+ "##ε": 826,
975
+ "##ν": 827,
976
+ "##ο": 828,
977
+ "##ς": 829,
978
+ "##ʻ": 830,
979
+ "##ا": 831,
980
+ "##ه": 832,
981
+ "##ł": 833,
982
+ "##": 834,
983
+ "##": 835,
984
+ "##": 836,
985
+ "##": 837,
986
+ "##": 838,
987
+ "##": 839,
988
+ "##": 840,
989
+ "##": 841,
990
+ "##": 842,
991
+ "##": 843,
992
+ "##": 844,
993
+ "##": 845,
994
+ "##": 846,
995
+ "##α": 847,
996
+ "##ω": 848,
997
+ "##": 849,
998
+ "##": 850,
999
+ "##": 851,
1000
+ "##": 852,
1001
+ "##": 853,
1002
+ "##": 854,
1003
+ "##פ": 855,
1004
+ "##ה": 856,
1005
+ "##": 857,
1006
+ "##": 858,
1007
+ "##": 859,
1008
+ "##": 860,
1009
+ "##": 861,
1010
+ "##": 862,
1011
+ "##": 863,
1012
+ "##": 864,
1013
+ "##": 865,
1014
+ "##": 866,
1015
+ "##": 867,
1016
+ "##": 868,
1017
+ "##": 869,
1018
+ "##": 870,
1019
+ "##": 871,
1020
+ "##": 872,
1021
+ "##ψ": 873,
1022
+ "##ι": 874,
1023
+ "##ˈ": 875,
1024
+ "##ɡ": 876,
1025
+ "##ɑ": 877,
1026
+ "##ː": 878,
1027
+ "##ə": 879,
1028
+ "##ɒ": 880,
1029
+ "##æ": 881,
1030
+ "##ъ": 882,
1031
+ "##р": 883,
1032
+ "##к": 884,
1033
+ "##в": 885,
1034
+ "##а": 886,
1035
+ "##": 887,
1036
+ "##λ": 888,
1037
+ "##χ": 889,
1038
+ "##": 890,
1039
+ "##": 891,
1040
+ "##": 892,
1041
+ "##": 893,
1042
+ "##": 894,
1043
+ "##": 895,
1044
+ "##": 896,
1045
+ "##": 897,
1046
+ "##": 898,
1047
+ "##ث": 899,
1048
+ "##م": 900,
1049
+ "##د": 901,
1050
+ "##о": 902,
1051
+ "##ю": 903,
1052
+ "##з": 904,
1053
+ "##е": 905,
1054
+ "##т": 906,
1055
+ "##с": 907,
1056
+ "##и": 908,
1057
+ "##": 909,
1058
+ "##": 910,
1059
+ "##ɪ": 911,
1060
+ "##": 912,
1061
+ "##ш": 913,
1062
+ "##н": 914,
1063
+ "##ц": 915,
1064
+ "##ь": 916,
1065
+ "##": 917,
1066
+ "##": 918,
1067
+ "##": 919,
1068
+ "##": 920,
1069
+ "##ø": 921,
1070
+ "##β": 922,
1071
+ "##": 923,
1072
+ "##": 924,
1073
+ "##": 925,
1074
+ "##": 926,
1075
+ "##": 927,
1076
+ "##": 928,
1077
+ "##": 929,
1078
+ "##": 930,
1079
+ "##": 931,
1080
+ "##": 932,
1081
+ "##": 933,
1082
+ "##": 934,
1083
+ "##": 935,
1084
+ "##ي": 936,
1085
+ "##ف": 937,
1086
+ "##": 938,
1087
+ "##τ": 939,
1088
+ "##μ": 940,
1089
+ "##": 941,
1090
+ "##η": 942,
1091
+ "##º": 943,
1092
+ "##ρ": 944,
1093
+ "##υ": 945,
1094
+ "##ص": 946,
1095
+ "##ن": 947,
1096
+ "##ו": 948,
1097
+ "##נ": 949,
1098
+ "##": 950,
1099
+ "##ل": 951,
1100
+ "##": 952,
1101
+ "##": 953,
1102
+ "##س": 954,
1103
+ "##ت": 955,
1104
+ "##": 956,
1105
+ "##": 957,
1106
+ "##ʃ": 958,
1107
+ "##ב": 959,
1108
+ "##ר": 960,
1109
+ "##ם": 961,
1110
+ "##": 962,
1111
+ "##": 963,
1112
+ "##": 964,
1113
+ "##ि": 965,
1114
+ "##đ": 966,
1115
+ "##": 967,
1116
+ "##": 968,
1117
+ "##": 969,
1118
+ "##ء": 970,
1119
+ "##": 971,
1120
+ "##": 972,
1121
+ "##ß": 973,
1122
+ "##ɛ": 974,
1123
+ "##": 975,
1124
+ "##": 976,
1125
+ "##": 977,
1126
+ "##ל": 978,
1127
+ "##л": 979,
1128
+ "##ы": 980,
1129
+ "##ɳ": 981,
1130
+ "##є": 982,
1131
+ "##π": 983,
1132
+ "##κ": 984,
1133
+ "##": 985,
1134
+ "##": 986,
1135
+ "##": 987,
1136
+ "##": 988,
1137
+ "##": 989,
1138
+ "##": 990,
1139
+ "##": 991,
1140
+ "##ر": 992,
1141
+ "##": 993,
1142
+ "##": 994,
1143
+ "##": 995,
1144
+ "##": 996,
1145
+ "##": 997,
1146
+ "##": 998,
1147
+ "##": 999,
1148
+ "##": 1000,
1149
+ "##": 1001,
1150
+ "##": 1002,
1151
+ "##х": 1003,
1152
+ "##": 1004,
1153
+ "##я": 1005,
1154
+ "##": 1006,
1155
+ "##м": 1007,
1156
+ "##ı": 1008,
1157
+ "##ܕ": 1009,
1158
+ "##ܝ": 1010,
1159
+ "##ܢ": 1011,
1160
+ "##ܬ": 1012,
1161
+ "##": 1013,
1162
+ "##": 1014,
1163
+ "##": 1015,
1164
+ "##γ": 1016,
1165
+ "##ɾ": 1017,
1166
+ "##": 1018,
1167
+ "##": 1019,
1168
+ "##ق": 1020,
1169
+ "##ش": 1021,
1170
+ "##و": 1022,
1171
+ "##": 1023,
1172
+ "##": 1024,
1173
+ "##": 1025,
1174
+ "##д": 1026,
1175
+ "##ð": 1027,
1176
+ "##": 1028,
1177
+ "##": 1029,
1178
+ "##": 1030,
1179
+ "##": 1031,
1180
+ "##ʊ": 1032,
1181
+ "##θ": 1033,
1182
+ "##п": 1034,
1183
+ "##г": 1035,
1184
+ "##ף": 1036,
1185
+ "##": 1037,
1186
+ "##": 1038,
1187
+ "##": 1039,
1188
+ "##": 1040,
1189
+ "##": 1041,
1190
+ "##": 1042,
1191
+ "##ʲ": 1043,
1192
+ "##": 1044,
1193
+ "##": 1045,
1194
+ "##": 1046,
1195
+ "##": 1047,
1196
+ "##": 1048,
1197
+ "##": 1049,
1198
+ "##": 1050,
1199
+ "##ת": 1051,
1200
+ "##א": 1052,
1201
+ "##י": 1053,
1202
+ "##ɽ": 1054,
1203
+ "##": 1055,
1204
+ "##": 1056,
1205
+ "##ب": 1057,
1206
+ "##ع": 1058,
1207
+ "##": 1059,
1208
+ "##": 1060,
1209
+ "##ɔ": 1061,
1210
  "##ะ": 1062,
1211
  "##ช": 1063,
1212
  "##น": 1064,
1213
+ "##": 1065,
1214
+ "##": 1066,
1215
+ "##": 1067,
1216
+ "##": 1068,
1217
+ "##ʒ": 1069,
1218
+ "##δ": 1070,
1219
+ "##ɜ": 1071,
1220
+ "##": 1072,
1221
+ "##": 1073,
1222
+ "##у": 1074,
1223
+ "##": 1075,
1224
+ "##ʁ": 1076,
1225
+ "##ɐ": 1077,
1226
+ "##": 1078,
1227
+ "##ˌ": 1079,
1228
+ "##ʿ": 1080,
1229
+ "##ן": 1081,
1230
+ "##": 1082,
1231
+ "##ס": 1083,
1232
+ "##": 1084,
1233
+ "##ж": 1085,
1234
+ "##ʔ": 1086,
1235
+ "##": 1087,
1236
+ "##": 1088,
1237
+ "##": 1089,
1238
+ "##خ": 1090,
1239
+ "##": 1091,
1240
+ "##": 1092,
1241
+ "##": 1093,
1242
+ "##": 1094,
1243
+ "##": 1095,
1244
+ "##σ": 1096,
1245
+ "##": 1097,
1246
+ "##ξ": 1098,
1247
+ "##ذ": 1099,
1248
+ "##ة": 1100,
1249
+ "##": 1101,
1250
+ "##": 1102,
1251
+ "##": 1103,
1252
+ "##": 1104,
1253
+ "##": 1105,
1254
+ "##": 1106,
1255
+ "##ܠ": 1107,
1256
+ "##ܗ": 1108,
1257
+ "##ܐ": 1109,
1258
+ "##ש": 1110,
1259
+ "##מ": 1111,
1260
+ "##צ": 1112,
1261
+ "##ɫ": 1113,
1262
+ "##ك": 1114,
1263
+ "##": 1115,
1264
+ "##": 1116,
1265
+ "##": 1117,
1266
+ "##ح": 1118,
1267
+ "##": 1119,
1268
+ "##": 1120,
1269
+ "##": 1121,
1270
+ "##": 1122,
1271
+ "##œ": 1123
1272
  }
1273
  }
1274
  }
tokenizer_config.json CHANGED
@@ -1,10 +1,10 @@
1
  {
 
2
  "cls_token": "[CLS]",
3
  "do_basic_tokenize": true,
4
  "do_lower_case": true,
5
  "mask_token": "[MASK]",
6
  "model_max_length": 512,
7
- "name_or_path": "/tmp/tmpwmqhff1f/decoder/processors",
8
  "never_split": null,
9
  "pad_token": "[PAD]",
10
  "sep_token": "[SEP]",
 
1
  {
2
+ "clean_up_tokenization_spaces": true,
3
  "cls_token": "[CLS]",
4
  "do_basic_tokenize": true,
5
  "do_lower_case": true,
6
  "mask_token": "[MASK]",
7
  "model_max_length": 512,
 
8
  "never_split": null,
9
  "pad_token": "[PAD]",
10
  "sep_token": "[SEP]",
vocab.txt CHANGED
@@ -788,337 +788,337 @@ z
788
 
789
 
790
 
791
- ##c
792
  ##r
793
- ##e
794
  ##a
795
- ##m
796
  ##i
797
  ##n
798
- ##g
799
- ##k
800
- ##p
801
  ##o
802
- ##t
803
  ##s
 
 
 
804
  ##l
805
  ##1
 
 
 
 
 
 
806
  ##h
 
 
 
 
 
 
 
807
  ##d
808
  ##j
809
- ##f
810
  ##y
811
- ##b
812
- ##u
813
- ##w
814
  ##v
 
815
  ##x
816
- ##5
817
- ##8
818
- ##3
819
- ##9
820
- ##7
821
  ##6
822
- ##z
823
- ##た
824
- ##め
825
- ##の
826
- ##0
827
- ##ा
828
- ##न
829
- ##ई
830
- ##4
831
- ##2
832
- ##ხ
833
- ##ვ
834
- ##ი
835
- ##ს
836
  ##q
837
- ##
838
- ##
839
- ##
840
- ##
841
- ##ɪ
842
- ##ォ
843
- ##ル
844
- ##テ
845
- ##ø
846
- ##ł
847
- ##া
848
- ##হ
849
- ##ল
850
- ##ʻ
851
- ##ण
852
- ##स
853
- ##व
854
- ##द
855
- ##л
856
- ##а
857
- ##α
858
  ##ο
859
  ##ς
860
- ##
 
 
 
861
  ##რ
862
- ##δ
863
- ##μ
864
- ##ə
865
- ##ː
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
866
  ##ˈ
867
- ##ɳ
868
- ##т
869
- ##е
870
- ##д
871
- ##р
872
- ##ツ
873
- ##ネ
874
- ##ɔ
875
  ##ɡ
876
- ##ʃ
 
 
877
  ##ɒ
878
- ##
879
- ##θ
880
- ##ʊ
881
  ##ъ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
882
  ##з
883
- ##н
 
884
  ##с
885
  ##и
886
- ##
 
 
 
 
 
 
 
 
887
  ##リ
 
888
  ##ス
889
- ##ل
890
- ##ا
891
- ##د
892
- ##ʁ
893
- ##ו
894
- ##פ
895
- ##נ
896
- ##ה
897
- ##い
898
- ##ち
899
- ##ゃ
900
  ##ん
901
- ##
902
- ##ε
903
- ##ρ
904
- ##о
905
- ##к
906
- ##п
907
- ##г
908
- ##ო
909
- ##ि
910
- ##ग
911
- ##გ
912
- ##ა
913
- ##ლ
914
- ##س
915
- ##ت
916
- ##ن
917
- ##す
918
- ##ν
919
  ##ラ
920
- ##ッ
921
  ##シ
922
  ##ュ
923
  ##ي
924
  ##ف
925
- ##æ
926
- ##ω
927
  ##τ
928
- ##ι
929
- ##ɛ
930
- ##ჲ
931
- ##ც
932
- ##ɑ
933
- ##ɾ
934
- ##ล
935
- ##อ
936
- ##ฮ
937
- ##ش
938
- ##خ
939
- ##ɽ
940
  ##η
941
- ##
942
- ##
943
- ##
944
- ##
945
- ##
946
- ##
947
- ##
 
 
 
948
  ##ト
949
- ##
950
- ##
951
- ##
952
- ##
953
- ##
954
- ##π
955
- ##κ
956
- ##λ
957
- ##
958
- ##
959
- ##
960
- ##
961
- ##م
962
- ##れ
963
- ##ウ
964
- ##ァ
965
- ##キ
966
- ##3
967
- ##क
968
- ##œ
969
- ##υ
970
- ##χ
971
- ##フ
972
  ##เ
973
  ##ป
974
  ##ย
975
- ##
976
- ##σ
977
- ##
978
- ##ว
979
- ##ร
980
- ##ص
981
- ##ニ
982
- ##र
983
- ##ق
984
- ##ܠ
985
- ##ܗ
986
- ##ܐ
987
- ##ж
988
- ##ゆ
989
- ##り
990
- ##ы
991
- ##в
992
- ##ף
993
- ##か
994
- ##ह
995
- ##く
996
- ##ð
997
- ##º
998
  ##ß
999
- ##
1000
- ##
1001
- ##
1002
- ##ן
1003
- ##ク
1004
- ##м
1005
- ##ハ
1006
- ##י
1007
- ##ס
1008
  ##ל
1009
- ##đ
1010
- ##
1011
- ##
1012
- ##ʔ
1013
- ##ه
1014
- ##ם
1015
- ##ξ
1016
- ##
1017
- ##
1018
- ##こ
1019
- ##ム
1020
- ##チ
1021
- ##ェ
1022
- ##ʲ
1023
- ##ב
1024
- ##ר
1025
- ##γ
1026
- ##א
1027
  ##ま
1028
  ##る
 
 
1029
  ##ر
1030
- ##ˌ
1031
- ##ث
1032
- ##
 
 
 
1033
  ##せ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1034
  ##წ
1035
  ##ფ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1036
  ##า
1037
  ##ณ
1038
  ##ม
1039
  ##ต
 
 
 
 
 
 
 
1040
  ##ب
1041
- ##は
1042
- ##サ
1043
  ##ع
1044
- ##ة
1045
- ##
1046
- ##ʿ
1047
- ##ɐ
1048
- ##ש
1049
- ##מ
1050
- ##צ
1051
- ##ܕ
1052
- ##ܝ
1053
- ##ܢ
1054
- ##ܬ
1055
- ##ภ
1056
- ##ด
1057
- ##ロ
1058
- ##ı
1059
- ##ш
1060
- ##ჳ
1061
- ##я
1062
- ##し
1063
  ##ะ
1064
  ##ช
1065
  ##น
1066
- ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1067
  ##ค
 
1068
  ##も
1069
- ##
1070
- ##
1071
- ##
1072
- ##
1073
- ##
1074
- ##
1075
- ##
1076
- ##
1077
- ##ᅧ
1078
- ##ᆼ
1079
- ##ᄋ
1080
- ##ᆫ
1081
- ##ᅢ
1082
- ##み
1083
- ##と
1084
- ##ك
1085
- ##є
1086
- ##ء
1087
- ##พ
1088
  ##っ
1089
  ##ょ
1090
  ##に
1091
- ##у
1092
- ##
1093
- ##و
1094
- ##ਲ
1095
- ##ਹ
1096
- ##х
1097
- ##ᅡ
1098
- ##ᆯ
1099
- ##β
1100
- ##ת
1101
- ##ɜ
1102
- ##ψ
1103
- ##ю
1104
- ##ാ
1105
- ##ഹ
1106
- ##ц
1107
- ##ь
1108
- ##ᅮ
1109
- ##ɫ
1110
  ##ذ
1111
- ##
1112
- ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1113
  ##ح
1114
- ##
1115
- ##
1116
- ##ʒ
1117
- ##
1118
- ##
1119
- ##ษ
1120
- ##ฐ
1121
- ##ल
1122
- ##ਾ
1123
- ##ミ
1124
- ##ノ
 
788
 
789
 
790
 
 
791
  ##r
 
792
  ##a
 
793
  ##i
794
  ##n
 
 
 
795
  ##o
 
796
  ##s
797
+ ##t
798
+ ##e
799
+ ##u
800
  ##l
801
  ##1
802
+ ##4
803
+ ##8
804
+ ##7
805
+ ##m
806
+ ##g
807
+ ##p
808
  ##h
809
+ ##b
810
+ ##z
811
+ ##2
812
+ ##5
813
+ ##0
814
+ ##w
815
+ ##f
816
  ##d
817
  ##j
818
+ ##c
819
  ##y
 
 
 
820
  ##v
821
+ ##k
822
  ##x
 
 
 
 
 
823
  ##6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
824
  ##q
825
+ ##9
826
+ ##3
827
+ ##ε
828
+ ##ν
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
829
  ##ο
830
  ##ς
831
+ ##ʻ
832
+ ##ا
833
+ ##ه
834
+ ##ł
835
  ##რ
836
+ ##
837
+ ##
838
+ ##
839
+ ##
840
+ ##ი
841
+ ##უ
842
+ ##ც
843
+ ##ल
844
+ ##ッ
845
+ ##ク
846
+ ##マ
847
+ ##ン
848
+ ##α
849
+ ##ω
850
+ ##れ
851
+ ##い
852
+ ##こ
853
+ ##と
854
+ ##ा
855
+ ##ह
856
+ ##פ
857
+ ##ה
858
+ ##ᅦ
859
+ ##ᄃ
860
+ ##ᅩ
861
+ ##ᆨ
862
+ ##ᄅ
863
+ ##ᅵ
864
+ ##ᆸ
865
+ ##ᄇ
866
+ ##ᅧ
867
+ ##ᆼ
868
+ ##ᄋ
869
+ ##ᆫ
870
+ ##ᅢ
871
+ ##แ
872
+ ##ก
873
+ ##ニ
874
+ ##ψ
875
+ ##ι
876
  ##ˈ
 
 
 
 
 
 
 
 
877
  ##ɡ
878
+ ##ɑ
879
+ ##ː
880
+ ##ə
881
  ##ɒ
882
+ ##æ
 
 
883
  ##ъ
884
+ ##р
885
+ ##к
886
+ ##в
887
+ ##а
888
+ ##し
889
+ ##λ
890
+ ##χ
891
+ ##タ
892
+ ##ム
893
+ ##チ
894
+ ##ェ
895
+ ##ー
896
+ ##ル
897
+ ##レ
898
+ ##イ
899
+ ##र
900
+ ##ث
901
+ ##م
902
+ ##د
903
+ ##о
904
+ ##ю
905
  ##з
906
+ ##е
907
+ ##т
908
  ##с
909
  ##и
910
+ ##
911
+ ##क
912
+ ##ɪ
913
+ ##お
914
+ ##ш
915
+ ##н
916
+ ##ц
917
+ ##ь
918
+ ##セ
919
  ##リ
920
+ ##オ
921
  ##ス
922
+ ##ø
923
+ ##β
924
+ ##
925
+ ##
926
+ ##
 
 
 
 
 
 
927
  ##ん
928
+ ##
929
+ ##
930
+ ##
931
+ ##
932
+ ##
933
+ ##
 
 
 
 
 
 
 
 
 
 
 
 
934
  ##ラ
 
935
  ##シ
936
  ##ュ
937
  ##ي
938
  ##ف
939
+ ##
 
940
  ##τ
941
+ ##μ
942
+ ##
 
 
 
 
 
 
 
 
 
 
943
  ##η
944
+ ##º
945
+ ##ρ
946
+ ##υ
947
+ ##ص
948
+ ##ن
949
+ ##ו
950
+ ##נ
951
+ ##ᵻ
952
+ ##ل
953
+ ##ロ
954
  ##ト
955
+ ##س
956
+ ##ت
957
+ ##
958
+ ##
959
+ ##ʃ
960
+ ##ב
961
+ ##ר
962
+ ##ם
963
+ ##
964
+ ##
965
+ ##
966
+ ##ि
967
+ ##đ
 
 
 
 
 
 
 
 
 
 
968
  ##เ
969
  ##ป
970
  ##ย
971
+ ##ء
972
+ ##
973
+ ##
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
974
  ##ß
975
+ ##ɛ
976
+ ##
977
+ ##
978
+ ##
 
 
 
 
 
979
  ##ל
980
+ ##л
981
+ ##ы
982
+ ##ɳ
983
+ ##є
984
+ ##π
985
+ ##κ
986
+ ##
987
+ ##
988
+ ##
 
 
 
 
 
 
 
 
 
989
  ##ま
990
  ##る
991
+ ##み
992
+ ##ნ
993
  ##ر
994
+ ##
995
+ ##
996
+ ##
997
+ ##ร
998
+ ##ナ
999
+ ##エ
1000
  ##せ
1001
+ ##ち
1002
+ ##ゃ
1003
+ ##ซ
1004
+ ##х
1005
+ ##ノ
1006
+ ##я
1007
+ ##ら
1008
+ ##м
1009
+ ##ı
1010
+ ##ܕ
1011
+ ##ܝ
1012
+ ##ܢ
1013
+ ##ܬ
1014
+ ##す
1015
+ ##き
1016
+ ##ひ
1017
+ ##γ
1018
+ ##ɾ
1019
+ ##ィ
1020
+ ##キ
1021
+ ##ق
1022
+ ##ش
1023
+ ##و
1024
+ ##ള
1025
+ ##ᅡ
1026
+ ##ᆯ
1027
+ ##д
1028
+ ##ð
1029
+ ##ჱ
1030
+ ##მ
1031
  ##წ
1032
  ##ფ
1033
+ ##ʊ
1034
+ ##θ
1035
+ ##п
1036
+ ##г
1037
+ ##ף
1038
+ ##め
1039
+ ##ツ
1040
+ ##ო
1041
+ ##ჳ
1042
+ ##া
1043
+ ##হ
1044
+ ##ʲ
1045
+ ##フ
1046
+ ##ล
1047
  ##า
1048
  ##ณ
1049
  ##ม
1050
  ##ต
1051
+ ##う
1052
+ ##ת
1053
+ ##א
1054
+ ##י
1055
+ ##ɽ
1056
+ ##ャ
1057
+ ##モ
1058
  ##ب
 
 
1059
  ##ع
1060
+ ##
1061
+ ##
1062
+ ##ɔ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1063
  ##ะ
1064
  ##ช
1065
  ##น
1066
+ ##
1067
+ ##ง
1068
+ ##พ
1069
+ ##ไ
1070
+ ##ʒ
1071
+ ##δ
1072
+ ##ɜ
1073
+ ##ਲ
1074
+ ##ਹ
1075
+ ##у
1076
+ ##ネ
1077
+ ##ʁ
1078
+ ##ɐ
1079
+ ##ਾ
1080
+ ##ˌ
1081
+ ##ʿ
1082
+ ##ן
1083
  ##ค
1084
+ ##ס
1085
  ##も
1086
+ ##ж
1087
+ ##ʔ
1088
+ ##
1089
+ ##
1090
+ ##
1091
+ ##خ
1092
+ ##
1093
+ ##
 
 
 
 
 
 
 
 
 
 
 
1094
  ##っ
1095
  ##ょ
1096
  ##に
1097
+ ##σ
1098
+ ##
1099
+ ##ξ
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1100
  ##ذ
1101
+ ##ة
1102
+ ##
1103
+ ##ァ
1104
+ ##3
1105
+ ##ハ
1106
+ ##ภ
1107
+ ##ด
1108
+ ##ܠ
1109
+ ##ܗ
1110
+ ##ܐ
1111
+ ##ש
1112
+ ##מ
1113
+ ##צ
1114
+ ##ɫ
1115
+ ##ك
1116
+ ##カ
1117
+ ##ョ
1118
+ ##ゥ
1119
  ##ح
1120
+ ##
1121
+ ##
1122
+ ##
1123
+ ##
1124
+ ##œ