Savoxism commited on
Commit
97f59b2
·
verified ·
1 Parent(s): 8e03439

Add new SentenceTransformer model.

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,691 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:89592
8
+ - loss:CachedMultipleNegativesRankingLoss
9
+ base_model: google-bert/bert-base-multilingual-cased
10
+ widget:
11
+ - source_sentence: Sau bao lâu thì người lao động được hưởng trợ cấp thất nghiệp tháng
12
+ đầu tiên?
13
+ sentences:
14
+ - 'Miễn nhiệm, cách chức Chủ tịch và thành viên Hội đồng thành viên
15
+
16
+ 1. Chủ tịch hoặc thành viên Hội đồng thành viên bị miễn nhiệm trong những trường
17
+ hợp sau đây:
18
+
19
+ a) Không còn đủ tiêu chuẩn và điều kiện quy định tại Điều 28 của Điều lệ này;
20
+
21
+ b) Có đơn xin từ chức và được Thủ tướng Chính phủ, Bộ Nông nghiệp và Phát triển
22
+ nông thôn chấp thuận bằng văn bản;
23
+
24
+ c) Có quyết định điều chuyển, bố trí công việc khác hoặc nghỉ hưu;
25
+
26
+ d) Không đủ sức khỏe đảm nhận công việc được giao; bị mất hoặc bị hạn chế năng
27
+ lực hành vi dân sự;
28
+
29
+ đ) Không đủ năng lực, trình độ, uy tín để thực hiện chức trách nhiệm vụ được giao
30
+ thuộc một trong các trường hợp sau đây:
31
+
32
+ - Trong 02 năm liên tiếp của nhiệm kỳ giữ chức vụ bị đánh giá, phân loại ở mức
33
+ không hoàn thành nhiệm vụ;
34
+
35
+ - Trong 01 nhiệm kỳ hoặc trong 02 nhiệm kỳ liên tiếp bị 02 lần xử lý kỷ luật liên
36
+ quan đến chức trách nhiệm vụ được giao;
37
+
38
+ - Để Tổng công ty mất đoàn kết hoặc làm Tổng công ty mất đoàn kết theo kết luận
39
+ của cấp có thẩm quyền.
40
+
41
+ - Bị cơ quan thanh tra, kiểm tra có thẩm quyền kết luận bằng văn bản về vi phạm
42
+ tư cách đạo đức hoặc vi phạm những quy định về những việc đảng viên không được
43
+ làm đối với thành viên Hội đồng thành viên là đảng viên.
44
+
45
+ e) Có hành vi vi phạm pháp luật thuộc một trong các trường hợp sau đây:
46
+
47
+ - Vi phạm pháp luật bị kỷ luật bằng hình thức khiển trách hoặc cảnh cáo mà yêu
48
+ cầu nhiệm vụ công tác cần phải thay thế;
49
+
50
+ - Bị cấp có thẩm quyền kết luận bằng văn bản về hành vi vi phạm pháp luật nhưng
51
+ chưa đến mức kỷ luật cách chức.
52
+
53
+ ...'
54
+ - 'PHẪU THUẬT ĐÓNG RÒ TRỰC TRÀNG - NIỆU ĐẠO
55
+
56
+ ...
57
+
58
+ IV. CHUẨN BỊ
59
+
60
+ 1. Người thực hiện: Phẫu thuật viên tiêu hóa hoặc tiết niệu hoặc phối hợp cả 2
61
+ chuyên khoa
62
+
63
+ 2. Người bệnh: Người bệnh cần được chuẩn bị đại tràng trước mổ như một phẫu thuật
64
+ cắt đoạn trực tràng.
65
+
66
+ 3. Phương tiện: Bộ dụng cụ đại phẫu
67
+
68
+ 4. Dự kiến thời gian phẫu thuật: 180 phút
69
+
70
+ V. CÁC BƯỚC TIẾN HÀNH
71
+
72
+ 1. Tư thế: Sản khoa
73
+
74
+ 2. Vô cảm: Tê tủy sống hoặc mê nội khí quản
75
+
76
+ 3. Kỹ thuật:
77
+
78
+ - Đường mổ: Đường trắng giữa dưới rốn kết hợp đường tầng sinh môn
79
+
80
+ - Tìm niệu đạo
81
+
82
+ - Rạch da đường ngang phía trước lỗ hậu môn, bóc tách các lớp để tìm đường rò
83
+ niệu đạo trực tràng.
84
+
85
+ *Về tiết niệu:
86
+
87
+ - Tìm thấy lỗ rò, đặt sonde bàng quang, khâu lại niệu đạo hoặc cắt đoạn nối tận
88
+ tận trên sonde bàng quang
89
+
90
+ - Mở thông bàng quang
91
+
92
+ *Về trực tràng:
93
+
94
+ - Khâu lại lỗ rò trực tràng
95
+
96
+ - Làm hậu môn nhân tạo trong trường hợp tổ chức thành trực tràng mủn, nguy cơ
97
+ bục cao'
98
+ - 'Giải quyết hưởng trợ cấp thất nghiệp
99
+
100
+ ...
101
+
102
+ 2. Chi trả trợ cấp thất nghiệp
103
+
104
+ a) Tổ chức bảo hiểm xã hội thực hiện chi trả trợ cấp thất nghiệp tháng đầu tiên
105
+ của người lao động trong thời hạn 05 ngày làm việc kể từ ngày nhận được quyết
106
+ định hưởng trợ cấp thất nghiệp;
107
+
108
+ b) Tổ chức bảo hiểm xã hội thực hiện chi trả trợ cấp thất nghiệp cho người lao
109
+ động từ tháng hưởng trợ cấp thất nghiệp thứ 2 trở đi trong thời hạn 05 ngày làm
110
+ việc, tính từ thời điểm ngày thứ 07 của tháng hưởng trợ cấp thất nghiệp đó nếu
111
+ không nhận được quyết định tạm dừng hoặc chấm dứt hưởng trợ cấp thất nghiệp đối
112
+ với người lao động. Trường hợp thời điểm ngày thứ 07 nêu trên là ngày nghỉ thì
113
+ thời hạn chi trả trợ cấp thất nghiệp được tính từ ngày làm việc tiếp theo.
114
+
115
+ ...'
116
+ - source_sentence: Ủy ban Dân tộc có phải là cơ quan ngang bộ của Chính phủ không?
117
+ sentences:
118
+ - 'Vị trí và chức năng
119
+
120
+ Ủy ban Dân tộc là cơ quan ngang bộ của Chính phủ, thực hiện chức năng quản lý
121
+ nhà nước về công tác dân tộc trong phạm vi cả nước; quản lý nhà nước các dịch
122
+ vụ công thuộc phạm vi quản lý của Ủy ban Dân tộc theo quy định của pháp luật.'
123
+ - "Miễn tiền sử dụng đất\nMiễn tiền sử dụng đất trong những trường hợp sau đây:\n\
124
+ 1. Miễn tiền sử dụng đất trong hạn mức giao đất ở khi sử dụng đất để thực hiện\
125
+ \ chính sách nhà ở, đất ở đối với người có công với cách mạng thuộc đối tượng\
126
+ \ được miễn tiền sử dụng đất theo quy định của pháp luật về người có công; hộ\
127
+ \ nghèo, hộ đồng bào dân tộc thiểu số ở vùng có điều kiện kinh tế - xã hội đặc\
128
+ \ biệt khó khăn, vùng biên giới, hải đảo; sử dụng đất để xây dựng nhà ở xã hội\
129
+ \ theo quy định của pháp luật về nhà ở; nhà ở cho người phải di dời do thiên tai.\n\
130
+ Việc xác định hộ nghèo theo quyết định của Thủ tướng Chính phủ; việc xác định\
131
+ \ hộ gia đình hoặc cá nhân là đồng bào dân tộc thiểu số theo quy định của Chính\
132
+ \ phủ.\n2. Miễn tiền sử dụng đất trong hạn mức giao đất ở khi cấp Giấy chứng nhận\
133
+ \ lần đầu đối với đất do chuyển mục đích sử dụng từ đất không phải là đất ở sang\
134
+ \ đất ở do tách hộ đối với hộ đồng bào dân tộc thiểu số, hộ nghèo tại các xã đặc\
135
+ \ biệt khó khăn vùng đồng bào dân tộc và miền núi theo Danh mục các xã đặc biệt\
136
+ \ khó khăn do Thủ tướng Chính phủ quy định.\n …\nGiảm tiền sử dụng đất\n1. Giảm\
137
+ \ 50% tiền sử dụng đất trong hạn mức đất ở đối với hộ gia đình là đồng bào dân\
138
+ \ tộc thiểu số, hộ nghèo tại các địa bàn không thuộc phạm vi quy định tại Khoản\
139
+ \ 2 Điều 11 Nghị định này khi được cơ quan nhà nước có thẩm quyền quyết định giao\
140
+ \ đất; công nhận (cấp Giấy chứng nhận) quyền sử dụng đất lần đầu đối với đất đang\
141
+ \ sử dụng hoặc khi được chuyển mục đích sử dụng từ đất không phải là đất ở sang\
142
+ \ đất ở.\nViệc xác định hộ nghèo theo quyết định của Thủ tướng Chính phủ; việc\
143
+ \ xác định hộ gia đình hoặc cá nhân là đồng bào dân tộc thiểu số theo quy định\
144
+ \ của Chính phủ.\n2. Giảm tiền sử dụng đất đối với đất ở trong hạn mức giao đất\
145
+ \ ở (bao gồm giao đất, chuyển mục đích sử dụng đất, cấp Giấy chứng nhận cho người\
146
+ \ đang sử dụng đất) đối với người có công với cách mạng mà thuộc diện được giảm\
147
+ \ tiền sử dụng đất theo quy định của pháp luật về người có công.\n..."
148
+ - 'Giám sát hoạt động của Công an nhân dân
149
+
150
+ 1. Quốc hội, Ủy ban Thường vụ Quốc hội, Hội đồng Dân tộc, Ủy ban của Quốc hội,
151
+ Đoàn đại biểu Quốc hội, đại biểu Quốc hội, Hội đồng nhân dân, Thường trực Hội
152
+ đồng nhân dân, Ban của Hội đồng nhân dân, Tổ đại biểu Hội đồng nhân dân và đại
153
+ biểu Hội đồng nhân dân, trong phạm vi nhiệm vụ, quyền hạn của mình, thực hiện
154
+ giám sát hoạt động của Công an nhân dân.
155
+
156
+ 2. Mặt trận Tổ quốc Việt Nam và các tổ chức thành viên của Mặt trận, trong phạm
157
+ vi nhiệm vụ, quyền hạn của mình, có trách nhiệm tuyên truyền, vận động mọi tầng
158
+ lớp nhân dân tham gia phong trào toàn dân bảo vệ an ninh Tổ quốc, phối hợp, cộng
159
+ tác, hỗ trợ Công an nhân dân thực hiện nhiệm vụ và xây dựng Công an nhân dân,
160
+ giám sát việc thực hiện pháp luật về Công an nhân dân.'
161
+ - source_sentence: Việc vận động quyên góp của Quỹ Phát triển sử học Việt Nam được
162
+ quy định thế nào?
163
+ sentences:
164
+ - 'Thư viện cơ sở giáo dục mầm non, cơ sở giáo dục phổ thông, cơ sở giáo dục nghề
165
+ nghiệp và cơ sở giáo dục khác
166
+
167
+ ...
168
+
169
+ 3. Thư viện cơ sở giáo dục phổ thông thực hiện chức năng, nhiệm vụ quy định tại
170
+ Điều 4 của Luật này và các chức năng, nhiệm vụ sau đây:
171
+
172
+ a) Phát triển tài nguyên thông tin phù hợp với nhu cầu học tập, nghiên cứu của
173
+ người học, người dạy, cán bộ quản lý và mục tiêu, nội dung, chương trình học tập,
174
+ giảng dạy của từng cấp học, chương trình học;
175
+
176
+ b) Tổ chức hoạt động khuyến đọc, hình thành thói quen, kỹ năng đọc của người học;
177
+ hướng dẫn sử dụng thư viện, trang bị kỹ năng tìm kiếm, khai thác, sử dụng thông
178
+ tin cho người học, người dạy và cán bộ quản lý;
179
+
180
+ c) Hỗ trợ việc học tập, giảng dạy, nghiên cứu và tổ chức các hoạt động giáo dục
181
+ khác;
182
+
183
+ d) Thực hiện nhiệm vụ khác do cơ sở giáo dục giao.'
184
+ - '"Điều 24. Nguyên tắc hoạt động và trường hợp sử dụng lực lượng vũ trang nhân
185
+ dân
186
+
187
+ ...
188
+
189
+ 2. Trường hợp sử dụng lực lượng vũ trang nhân dân được quy định như sau:
190
+
191
+ a) Trong tình trạng chiến tranh, tình trạng khẩn cấp về quốc phòng thực hiện theo
192
+ lệnh của Chủ tịch nước và quy định khác của pháp luật có liên quan;
193
+
194
+ b) Trong thi hành lệnh thiết quân luật, giới nghiêm thực hiện theo quy định của
195
+ Luật này và quy định khác của pháp luật có liên quan;
196
+
197
+ c) Trong tình trạng khẩn cấp do thảm họa, dịch bệnh nguy hiểm hoặc tình hình đe
198
+ dọa nghiêm trọng đến an ninh quốc gia, trật tự, an toàn xã hội thực hiện theo
199
+ quy định của pháp luật về tình trạng khẩn cấp và quy định khác của pháp luật có
200
+ liên quan;
201
+
202
+ d) Khi có nguy cơ đe dọa an ninh quốc gia, trật tự, an toàn xã hội nhưng chưa
203
+ đến mức ban bố tình trạng khẩn cấp thực hiện theo quy định của pháp luật về an
204
+ ninh quốc gia và quy định khác của pháp luật có liên quan;
205
+
206
+ đ) Khi tham gia hoạt động góp phần bảo vệ hòa bình ở khu vực và trên thế giới
207
+ thực hiện theo quyết định của Hội đồng Quốc phòng và An ninh;
208
+
209
+ e) Khi xảy ra tình huống phức tạp về an ninh quốc gia, trật tự, an toàn xã hội;
210
+ đấu tranh phòng, chống tội phạm; tham gia phòng, chống, khắc phục sự cố, thiên
211
+ tai, dịch bệnh, việc sử dụng lực lượng vũ trang do Chính phủ quy định."'
212
+ - 'Nguyên tắc vận động
213
+
214
+ 1. Quỹ được vận động quyên góp, vận động tài trợ ở trong nước và ở nước ngoài
215
+ nhằm chuẩn bị thực hiện mục tiêu hoạt động theo quy định của Điều lệ Quỹ và theo
216
+ quy định của pháp luật.
217
+
218
+ 2. Đối với các cuộc vận động quyên góp, vận động tài trợ các tổ chức, cá nhân
219
+ ở nước ngoài hoặc trong phạm vi cả nước Quỹ phải có đề án và được cơ quan nhà
220
+ nước có thẩm quyền cho phép thành lập Quỹ đồng ý bằng văn bản.'
221
+ - source_sentence: Đội tuyển thể thao quốc gia gồm những đội tuyển nào?
222
+ sentences:
223
+ - '“Điều 5. Trách nhiệm giải quyết và chi trả
224
+
225
+ [...]
226
+
227
+ 4. Thời hạn giải quyết và chi trả
228
+
229
+ 4.1. Trường hợp đơn vị SDLĐ đề nghị: Tối đa 06 ngày làm việc kể từ khi nhận đủ
230
+ hồ sơ theo quy định.
231
+
232
+ 4.2. Trường hợp người lao động, thân nhân người lao động nộp hồ sơ trực tiếp cho
233
+ cơ quan BHXH: Tối đa 03 ngày làm việc kể từ ngày nhận đủ hồ sơ theo quy định.
234
+
235
+ [...]”'
236
+ - 'Mở sổ, ghi sổ, khóa sổ và lưu trữ sổ kế toán
237
+
238
+ 1. Sổ kế toán phải mở vào đầu kỳ kế toán năm; đối với đơn vị kế toán mới thành
239
+ lập, sổ kế toán phải mở từ ngày thành lập.Hiệu lực thi hành
240
+
241
+ 1. Thông tư này có hiệu lực từ ngày 15/02/2023.
242
+
243
+ 2. Kể từ ngày Thông tư này có hiệu lực thi hành, Quyết định số 37/2007/QĐ-NHNN
244
+ ngày 26/10/2007 của Thống đốc Ngân hàng Nhà nước ban hành chế độ kế toán giao
245
+ nhận, điều chuyển, phát hành, thu hồi và tiêu hủy tiền mặt hết hiệu lực thi hành.'
246
+ - 'Trong quy chế này các từ ngữ dưới đây được hiểu như sau:
247
+
248
+ 1. “Đội tuyển thể thao quốc gia” bao gồm: đội dự tuyển, đội tuyển quốc gia, đội
249
+ dự tuyển trẻ, đội tuyển trẻ quốc gia từng môn thể thao.
250
+
251
+ 2. “Vận động viên đội tuyển thể thao quốc gia” bao gồm: những vận động viên được
252
+ Ủy ban Thể dục thể thao quyết định triệu tập vào các đội tuyển thể thao quốc gia
253
+ để tập huấn, thi đấu các giải thể thao quốc tế.
254
+
255
+ ...'
256
+ - source_sentence: Tổ chức sinh hoạt tôn giáo tập trung cần đáp ứng điều kiện gì?
257
+ sentences:
258
+ - 'ĐIỀU TRỊ
259
+
260
+ ...
261
+
262
+ 3. Điều trị hỗ trợ
263
+
264
+ a) Hạ sốt.
265
+
266
+ Chỉ dùng paracetamol khi nhiệt độ trên 39oC (không dùng thuốc hạ sốt nhóm salicylate
267
+ như aspirin).
268
+
269
+ b) Bảo đảm chế độ dinh dưỡng và chăm sóc.
270
+
271
+ - Dinh dưỡng:
272
+
273
+ + Người bệnh nhẹ: cho ăn bằng đường miệng.
274
+
275
+ + Người bệnh nặng: cho ăn sữa và bột dinh dưỡng qua ống thông dạ dày.
276
+
277
+ + Nếu người bệnh không ăn được phải kết hợp nuôi dưỡng bằng đường tĩnh mạch.
278
+
279
+ - Chăm sóc hô hấp: giúp người bệnh ho, khạc; vỗ rung vùng ngực; hút đờm.
280
+
281
+ c) Sử dụng kháng sinh thích hợp khi có bội nhiễm vi khuẩn
282
+
283
+ d) Hỗ trợ hô hấp khi có suy hô hấp:
284
+
285
+ - Nằm đầu cao 30-450.
286
+
287
+ - Cho người bệnh thở oxy với lưu lượng thích hợp.
288
+
289
+ - Những trường hợp không đáp ứng với thở oxy cần hỗ trợ hô hấp bằng máy thở không
290
+ xâm nhập hoặc xâm nhập.
291
+
292
+ e) Phát hiện và điều trị suy đa phủ tạng.
293
+
294
+ g) Những trường hợp nặng điều trị giống như cúm A (H5N1) nặng đã được Bộ Y tế
295
+ ban hành.
296
+
297
+ ...'
298
+ - '"Điều 16. Điều kiện đăng ký sinh hoạt tôn giáo tập trung
299
+
300
+ 1. Tổ chức tôn giáo đăng ký sinh hoạt tôn giáo tập trung cho tín đồ tại những
301
+ nơi chưa đủ điều kiện thành lập tổ chức tôn giáo trực thuộc; tổ chức được cấp
302
+ chứng nhận đăng ký hoạt động tôn giáo đăng ký sinh hoạt tôn giáo tập trung cho
303
+ những người thuộc tổ chức khi đáp ứng đủ các điều kiện sau đây:
304
+
305
+ a) Có địa điểm hợp pháp để sinh hoạt tôn giáo;
306
+
307
+ b) Nhóm sinh hoạt tôn giáo tập trung có người đại diện là công dân Việt Nam thường
308
+ trú tại Việt Nam, có năng lực hành vi dân sự đầy đủ; không trong thời gian bị
309
+ áp dụng biện pháp xử lý hành chính trong lĩnh vực tín ngưỡng, tôn giáo; không
310
+ có án tích hoặc không phải là người đang bị buộc tội theo quy định của pháp luật
311
+ về tố tụng hình sự;
312
+
313
+ c) Nội dung sinh hoạt tôn giáo không thuộc trường hợp quy định tại Điều 5 của
314
+ Luật này.
315
+
316
+ 2. Những người theo tôn giáo không thuộc trường hợp quy định tại khoản 1 Điều
317
+ này được đăng ký sinh hoạt tôn giáo tập trung khi đáp ứng đủ các điều kiện quy
318
+ định tại khoản 1 Điều này và các điều kiện sau đây:
319
+
320
+ a) Có giáo lý, giáo luật;
321
+
322
+ b) Tên của nhóm sinh hoạt tôn giáo tập trung không trùng với tên tổ chức tôn giáo
323
+ hoặc tổ chức đã được cấp chứng nhận đăng ký hoạt động tôn giáo, tên tổ chức chính
324
+ trị, tổ chức chính trị - xã hội hoặc tên danh nhân, anh hùng dân tộc."'
325
+ - 'Yêu cầu về chất lượng
326
+
327
+ 2.1 Yêu cầu tối thiểu
328
+
329
+ Trong tất cả các hạng, tùy theo yêu cầu cụ thể cho từng hạng và dung sai cho phép,
330
+ roi quả tươi phải:
331
+
332
+ - nguyên vẹn có hoặc không có cuống;
333
+
334
+ - đặc trưng cho giống;
335
+
336
+ - tươi và rắn chắc;
337
+
338
+ - không bị dập nát hoặc hư hỏng đến mức không phù hợp cho sử dụng;
339
+
340
+ - sạch;
341
+
342
+ - hầu như không có bất kỳ tạp chất lạ nào nhìn thấy được bằng mắt thường;
343
+
344
+ - hầu như không bị hư hỏng cơ học và/hoặc sinh lý học;
345
+
346
+ - hầu như không chứa sinh vật gây hại và hư hỏng ảnh hưởng đến hình thức bên ngoài
347
+ của sản phẩm;
348
+
349
+ - không bị ẩm bất thường ngoài vỏ, trừ khi bị ngưng tụ nước do vừa đưa ra khỏi
350
+ môi trường bảo quản lạnh;
351
+
352
+ - hầu như không có bất kỳ mùi và/hoặc vị lạ nào:
353
+
354
+ 2.1.1 Roi quả tươi phải được thu hoạch khi đạt độ thích hợp, phù hợp với tiêu
355
+ chí của vùng trồng.
356
+
357
+ Độ chín và tình trạng của roi quả tươi phải:
358
+
359
+ - chịu được vận chuyển và bốc dỡ; và
360
+
361
+ - đến nơi tiêu thụ với trạng thái tốt.
362
+
363
+ ...'
364
+ pipeline_tag: sentence-similarity
365
+ library_name: sentence-transformers
366
+ ---
367
+
368
+ # SentenceTransformer based on google-bert/bert-base-multilingual-cased
369
+
370
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [google-bert/bert-base-multilingual-cased](https://huggingface.co/google-bert/bert-base-multilingual-cased). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
371
+
372
+ ## Model Details
373
+
374
+ ### Model Description
375
+ - **Model Type:** Sentence Transformer
376
+ - **Base model:** [google-bert/bert-base-multilingual-cased](https://huggingface.co/google-bert/bert-base-multilingual-cased) <!-- at revision 3f076fdb1ab68d5b2880cb87a0886f315b8146f8 -->
377
+ - **Maximum Sequence Length:** 512 tokens
378
+ - **Output Dimensionality:** 768 tokens
379
+ - **Similarity Function:** Cosine Similarity
380
+ <!-- - **Training Dataset:** Unknown -->
381
+ <!-- - **Language:** Unknown -->
382
+ <!-- - **License:** Unknown -->
383
+
384
+ ### Model Sources
385
+
386
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
387
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
388
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
389
+
390
+ ### Full Model Architecture
391
+
392
+ ```
393
+ SentenceTransformer(
394
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
395
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
396
+ )
397
+ ```
398
+
399
+ ## Usage
400
+
401
+ ### Direct Usage (Sentence Transformers)
402
+
403
+ First install the Sentence Transformers library:
404
+
405
+ ```bash
406
+ pip install -U sentence-transformers
407
+ ```
408
+
409
+ Then you can load this model and run inference.
410
+ ```python
411
+ from sentence_transformers import SentenceTransformer
412
+
413
+ # Download from the 🤗 Hub
414
+ model = SentenceTransformer("Savoxism/Finetuned-BERT-Multilingual-Legal-Doc-Retrieval")
415
+ # Run inference
416
+ sentences = [
417
+ 'Tổ chức sinh hoạt tôn giáo tập trung cần đáp ứng điều kiện gì?',
418
+ '"Điều 16. Điều kiện đăng ký sinh hoạt tôn giáo tập trung\n1. Tổ chức tôn giáo đăng ký sinh hoạt tôn giáo tập trung cho tín đồ tại những nơi chưa đủ điều kiện thành lập tổ chức tôn giáo trực thuộc; tổ chức được cấp chứng nhận đăng ký hoạt động tôn giáo đăng ký sinh hoạt tôn giáo tập trung cho những người thuộc tổ chức khi đáp ứng đủ các điều kiện sau đây:\na) Có địa điểm hợp pháp để sinh hoạt tôn giáo;\nb) Nhóm sinh hoạt tôn giáo tập trung có người đại diện là công dân Việt Nam thường trú tại Việt Nam, có năng lực hành vi dân sự đầy đủ; không trong thời gian bị áp dụng biện pháp xử lý hành chính trong lĩnh vực tín ngưỡng, tôn giáo; không có án tích hoặc không phải là người đang bị buộc tội theo quy định của pháp luật về tố tụng hình sự;\nc) Nội dung sinh hoạt tôn giáo không thuộc trường hợp quy định tại Điều 5 của Luật này.\n2. Những người theo tôn giáo không thuộc trường hợp quy định tại khoản 1 Điều này được đăng ký sinh hoạt tôn giáo tập trung khi đáp ứng đủ các điều kiện quy định tại khoản 1 Điều này và các điều kiện sau đây:\na) Có giáo lý, giáo luật;\nb) Tên của nhóm sinh hoạt tôn giáo tập trung không trùng với tên tổ chức tôn giáo hoặc tổ chức đã được cấp chứng nhận đăng ký hoạt động tôn giáo, tên tổ chức chính trị, tổ chức chính trị - xã hội hoặc tên danh nhân, anh hùng dân tộc."',
419
+ 'ĐIỀU TRỊ\n...\n3. Điều trị hỗ trợ\na) Hạ sốt.\nChỉ dùng paracetamol khi nhiệt độ trên 39oC (không dùng thuốc hạ sốt nhóm salicylate như aspirin).\nb) Bảo đảm chế độ dinh dưỡng và chăm sóc.\n- Dinh dưỡng:\n+ Người bệnh nhẹ: cho ăn bằng đường miệng.\n+ Người bệnh nặng: cho ăn sữa và bột dinh dưỡng qua ống thông dạ dày.\n+ Nếu người bệnh không ăn được phải kết hợp nuôi dưỡng bằng đường tĩnh mạch.\n- Chăm sóc hô hấp: giúp người bệnh ho, khạc; vỗ rung vùng ngực; hút đờm.\nc) Sử dụng kháng sinh thích hợp khi có bội nhiễm vi khuẩn\nd) Hỗ trợ hô hấp khi có suy hô hấp:\n- Nằm đầu cao 30-450.\n- Cho người bệnh thở oxy với lưu lượng thích hợp.\n- Những trường hợp không đáp ứng với thở oxy cần hỗ trợ hô hấp bằng máy thở không xâm nhập hoặc xâm nhập.\ne) Phát hiện và điều trị suy đa phủ tạng.\ng) Những trường hợp nặng điều trị giống như cúm A (H5N1) nặng đã được Bộ Y tế ban hành.\n...',
420
+ ]
421
+ embeddings = model.encode(sentences)
422
+ print(embeddings.shape)
423
+ # [3, 768]
424
+
425
+ # Get the similarity scores for the embeddings
426
+ similarities = model.similarity(embeddings, embeddings)
427
+ print(similarities.shape)
428
+ # [3, 3]
429
+ ```
430
+
431
+ <!--
432
+ ### Direct Usage (Transformers)
433
+
434
+ <details><summary>Click to see the direct usage in Transformers</summary>
435
+
436
+ </details>
437
+ -->
438
+
439
+ <!--
440
+ ### Downstream Usage (Sentence Transformers)
441
+
442
+ You can finetune this model on your own dataset.
443
+
444
+ <details><summary>Click to expand</summary>
445
+
446
+ </details>
447
+ -->
448
+
449
+ <!--
450
+ ### Out-of-Scope Use
451
+
452
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
453
+ -->
454
+
455
+ <!--
456
+ ## Bias, Risks and Limitations
457
+
458
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
459
+ -->
460
+
461
+ <!--
462
+ ### Recommendations
463
+
464
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
465
+ -->
466
+
467
+ ## Training Details
468
+
469
+ ### Training Dataset
470
+
471
+ #### Unnamed Dataset
472
+
473
+
474
+ * Size: 89,592 training samples
475
+ * Columns: <code>sentence_0</code> and <code>sentence_1</code>
476
+ * Approximate statistics based on the first 1000 samples:
477
+ | | sentence_0 | sentence_1 |
478
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
479
+ | type | string | string |
480
+ | details | <ul><li>min: 8 tokens</li><li>mean: 25.78 tokens</li><li>max: 49 tokens</li></ul> | <ul><li>min: 27 tokens</li><li>mean: 274.44 tokens</li><li>max: 512 tokens</li></ul> |
481
+ * Samples:
482
+ | sentence_0 | sentence_1 |
483
+ |:------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
484
+ | <code>Người sử dụng lao động khi thực hiện đào tạo nghề cần thông báo kết quả đào tạo đến cơ quan nào?</code> | <code>Trách nhiệm của người sử dụng lao động về đào tạo, bồi dưỡng, nâng cao trình độ, kỹ năng nghề<br>1. Người sử dụng lao động xây dựng kế hoạch hằng năm và dành kinh phí cho việc đào tạo, bồi dưỡng, nâng cao trình độ, kỹ năng nghề, phát triển kỹ năng nghề cho người lao động đang làm việc cho mình; đào tạo cho người lao động trước khi chuyển làm nghề khác cho mình.<br>2. Hằng năm, người sử dụng lao động thông báo kết quả đào tạo, bồi dưỡng, nâng cao trình độ, kỹ năng nghề cho cơ quan chuyên môn về lao động thuộc Ủy ban nhân dân cấp tỉnh.</code> |
485
+ | <code>Thương nhân kinh doanh Siêu thị kinh doanh tổng hợp có thể tự tiến hành phân hạng Siêu thị của mình không?</code> | <code>Phân hạng, tên gọi và biển hiệu Siêu thị, Trung tâm thương mại<br>1. Thương nhân kinh doanh Siêu thị hoặc Trung tâm thương mại tự tiến hành phân hạng Siêu thị, Trung tâm thương mại của mình căn cứ các tiêu chuẩn tại Điều 3 và Điều 4 Quy chế này theo sự hướng dẫn và kiểm tra của Sở thương mại tỉnh, thành phố trực thuộc Trung ương (sau đây gọi tắt là Sở Thương mại).<br>...</code> |
486
+ | <code>Căn hộ chung cư phải đảm bảo có diện tích tối thiểu bao nhiêu theo quy định hiện nay?</code> | <code>"2.2.4 Căn hộ chung cư<br>2.2.4.1 Phải có tối thiểu một phòng ở và một khu vệ sinh. Diện tích sử dụng tối thiểu của căn hộ chung cư không nhỏ hơn 25 m2.<br>2.2.4.2 Đối với dự án nhà ở thương m��i, phải đảm bảo tỷ lệ căn hộ chung cư có diện tích nhỏ hơn 45 m2 không vượt quá 25 % tổng số căn hộ chung cư của dự án.<br>2.2.4.3 Căn hộ chung cư phải được chiếu sáng tự nhiên. Căn hộ có từ 2 phòng ở trở lên, cho phép một phòng ở không có chiếu sáng tự nhiên.<br>2.2.4.4 Phòng ngủ phải được thông thoáng, chiếu sáng tự nhiên. Diện tích sử dụng của phòng ngủ trong căn hộ chung cư không được nhỏ hơn 9 m2."</code> |
487
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
488
+ ```json
489
+ {
490
+ "scale": 20.0,
491
+ "similarity_fct": "cos_sim"
492
+ }
493
+ ```
494
+
495
+ ### Training Hyperparameters
496
+ #### Non-Default Hyperparameters
497
+
498
+ - `per_device_train_batch_size`: 32
499
+ - `per_device_eval_batch_size`: 32
500
+ - `num_train_epochs`: 2
501
+ - `multi_dataset_batch_sampler`: round_robin
502
+
503
+ #### All Hyperparameters
504
+ <details><summary>Click to expand</summary>
505
+
506
+ - `overwrite_output_dir`: False
507
+ - `do_predict`: False
508
+ - `eval_strategy`: no
509
+ - `prediction_loss_only`: True
510
+ - `per_device_train_batch_size`: 32
511
+ - `per_device_eval_batch_size`: 32
512
+ - `per_gpu_train_batch_size`: None
513
+ - `per_gpu_eval_batch_size`: None
514
+ - `gradient_accumulation_steps`: 1
515
+ - `eval_accumulation_steps`: None
516
+ - `torch_empty_cache_steps`: None
517
+ - `learning_rate`: 5e-05
518
+ - `weight_decay`: 0.0
519
+ - `adam_beta1`: 0.9
520
+ - `adam_beta2`: 0.999
521
+ - `adam_epsilon`: 1e-08
522
+ - `max_grad_norm`: 1
523
+ - `num_train_epochs`: 2
524
+ - `max_steps`: -1
525
+ - `lr_scheduler_type`: linear
526
+ - `lr_scheduler_kwargs`: {}
527
+ - `warmup_ratio`: 0.0
528
+ - `warmup_steps`: 0
529
+ - `log_level`: passive
530
+ - `log_level_replica`: warning
531
+ - `log_on_each_node`: True
532
+ - `logging_nan_inf_filter`: True
533
+ - `save_safetensors`: True
534
+ - `save_on_each_node`: False
535
+ - `save_only_model`: False
536
+ - `restore_callback_states_from_checkpoint`: False
537
+ - `no_cuda`: False
538
+ - `use_cpu`: False
539
+ - `use_mps_device`: False
540
+ - `seed`: 42
541
+ - `data_seed`: None
542
+ - `jit_mode_eval`: False
543
+ - `use_ipex`: False
544
+ - `bf16`: False
545
+ - `fp16`: False
546
+ - `fp16_opt_level`: O1
547
+ - `half_precision_backend`: auto
548
+ - `bf16_full_eval`: False
549
+ - `fp16_full_eval`: False
550
+ - `tf32`: None
551
+ - `local_rank`: 0
552
+ - `ddp_backend`: None
553
+ - `tpu_num_cores`: None
554
+ - `tpu_metrics_debug`: False
555
+ - `debug`: []
556
+ - `dataloader_drop_last`: False
557
+ - `dataloader_num_workers`: 0
558
+ - `dataloader_prefetch_factor`: None
559
+ - `past_index`: -1
560
+ - `disable_tqdm`: False
561
+ - `remove_unused_columns`: True
562
+ - `label_names`: None
563
+ - `load_best_model_at_end`: False
564
+ - `ignore_data_skip`: False
565
+ - `fsdp`: []
566
+ - `fsdp_min_num_params`: 0
567
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
568
+ - `fsdp_transformer_layer_cls_to_wrap`: None
569
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
570
+ - `deepspeed`: None
571
+ - `label_smoothing_factor`: 0.0
572
+ - `optim`: adamw_torch
573
+ - `optim_args`: None
574
+ - `adafactor`: False
575
+ - `group_by_length`: False
576
+ - `length_column_name`: length
577
+ - `ddp_find_unused_parameters`: None
578
+ - `ddp_bucket_cap_mb`: None
579
+ - `ddp_broadcast_buffers`: False
580
+ - `dataloader_pin_memory`: True
581
+ - `dataloader_persistent_workers`: False
582
+ - `skip_memory_metrics`: True
583
+ - `use_legacy_prediction_loop`: False
584
+ - `push_to_hub`: False
585
+ - `resume_from_checkpoint`: None
586
+ - `hub_model_id`: None
587
+ - `hub_strategy`: every_save
588
+ - `hub_private_repo`: False
589
+ - `hub_always_push`: False
590
+ - `gradient_checkpointing`: False
591
+ - `gradient_checkpointing_kwargs`: None
592
+ - `include_inputs_for_metrics`: False
593
+ - `eval_do_concat_batches`: True
594
+ - `fp16_backend`: auto
595
+ - `push_to_hub_model_id`: None
596
+ - `push_to_hub_organization`: None
597
+ - `mp_parameters`:
598
+ - `auto_find_batch_size`: False
599
+ - `full_determinism`: False
600
+ - `torchdynamo`: None
601
+ - `ray_scope`: last
602
+ - `ddp_timeout`: 1800
603
+ - `torch_compile`: False
604
+ - `torch_compile_backend`: None
605
+ - `torch_compile_mode`: None
606
+ - `dispatch_batches`: None
607
+ - `split_batches`: None
608
+ - `include_tokens_per_second`: False
609
+ - `include_num_input_tokens_seen`: False
610
+ - `neftune_noise_alpha`: None
611
+ - `optim_target_modules`: None
612
+ - `batch_eval_metrics`: False
613
+ - `eval_on_start`: False
614
+ - `use_liger_kernel`: False
615
+ - `eval_use_gather_object`: False
616
+ - `batch_sampler`: batch_sampler
617
+ - `multi_dataset_batch_sampler`: round_robin
618
+
619
+ </details>
620
+
621
+ ### Training Logs
622
+ | Epoch | Step | Training Loss |
623
+ |:------:|:----:|:-------------:|
624
+ | 0.1786 | 500 | 0.6029 |
625
+ | 0.3571 | 1000 | 0.1195 |
626
+ | 0.5357 | 1500 | 0.0848 |
627
+ | 0.7143 | 2000 | 0.0719 |
628
+ | 0.8929 | 2500 | 0.0645 |
629
+ | 1.0714 | 3000 | 0.0547 |
630
+ | 1.25 | 3500 | 0.0299 |
631
+ | 1.4286 | 4000 | 0.033 |
632
+ | 1.6071 | 4500 | 0.0292 |
633
+ | 1.7857 | 5000 | 0.0244 |
634
+ | 1.9643 | 5500 | 0.0268 |
635
+
636
+
637
+ ### Framework Versions
638
+ - Python: 3.10.12
639
+ - Sentence Transformers: 3.1.1
640
+ - Transformers: 4.45.2
641
+ - PyTorch: 2.5.1+cu121
642
+ - Accelerate: 1.2.1
643
+ - Datasets: 2.21.0
644
+ - Tokenizers: 0.20.3
645
+
646
+ ## Citation
647
+
648
+ ### BibTeX
649
+
650
+ #### Sentence Transformers
651
+ ```bibtex
652
+ @inproceedings{reimers-2019-sentence-bert,
653
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
654
+ author = "Reimers, Nils and Gurevych, Iryna",
655
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
656
+ month = "11",
657
+ year = "2019",
658
+ publisher = "Association for Computational Linguistics",
659
+ url = "https://arxiv.org/abs/1908.10084",
660
+ }
661
+ ```
662
+
663
+ #### CachedMultipleNegativesRankingLoss
664
+ ```bibtex
665
+ @misc{gao2021scaling,
666
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
667
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
668
+ year={2021},
669
+ eprint={2101.06983},
670
+ archivePrefix={arXiv},
671
+ primaryClass={cs.LG}
672
+ }
673
+ ```
674
+
675
+ <!--
676
+ ## Glossary
677
+
678
+ *Clearly define terms in order to be accessible across audiences.*
679
+ -->
680
+
681
+ <!--
682
+ ## Model Card Authors
683
+
684
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
685
+ -->
686
+
687
+ <!--
688
+ ## Model Card Contact
689
+
690
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
691
+ -->
config.json ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "google-bert/bert-base-multilingual-cased",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "directionality": "bidi",
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 768,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 3072,
14
+ "layer_norm_eps": 1e-12,
15
+ "max_position_embeddings": 512,
16
+ "model_type": "bert",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 0,
20
+ "pooler_fc_size": 768,
21
+ "pooler_num_attention_heads": 12,
22
+ "pooler_num_fc_layers": 3,
23
+ "pooler_size_per_head": 128,
24
+ "pooler_type": "first_token_transform",
25
+ "position_embedding_type": "absolute",
26
+ "torch_dtype": "float32",
27
+ "transformers_version": "4.45.2",
28
+ "type_vocab_size": 2,
29
+ "use_cache": true,
30
+ "vocab_size": 119547
31
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.1.1",
4
+ "transformers": "4.45.2",
5
+ "pytorch": "2.5.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ab7dca186b9e3714cd5907843a9d547116e2ea7057a00f065184815f791bf508
3
+ size 711436136
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": "[CLS]",
3
+ "mask_token": "[MASK]",
4
+ "pad_token": "[PAD]",
5
+ "sep_token": "[SEP]",
6
+ "unk_token": "[UNK]"
7
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": false,
45
+ "cls_token": "[CLS]",
46
+ "do_lower_case": false,
47
+ "mask_token": "[MASK]",
48
+ "model_max_length": 512,
49
+ "pad_token": "[PAD]",
50
+ "sep_token": "[SEP]",
51
+ "strip_accents": null,
52
+ "tokenize_chinese_chars": true,
53
+ "tokenizer_class": "BertTokenizer",
54
+ "unk_token": "[UNK]"
55
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff