hungq commited on
Commit
d7e66d9
·
verified ·
1 Parent(s): 4dcfb52

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,590 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - dense
7
+ - generated_from_trainer
8
+ - dataset_size:2857
9
+ - loss:CosineSimilarityLoss
10
+ base_model: keepitreal/vietnamese-sbert
11
+ widget:
12
+ - source_sentence: "Bậc trình đ ộ dựa trên quy đ ịnh tại Bảng 2.1 c ủa Phụ lục II.\
13
+ \ \nĐối với các ch ứng ch ỉ APTIS ESOL, Cambridge Assessment English, PEIC: Sinh\
14
+ \ viên đ ạt chứng ch ỉ A1 sẽ thuộc Nhóm 2; đạt \nchứng ch ỉ A2 sẽ thuộc Nhóm\
15
+ \ 3. \n \n2 \n \n \n Bảng 3.2 Yêu c ầu trình đ ộ tiếng Anh theo học kỳ và chu\
16
+ \ ẩn ngoại ngữ đầu ra khi xét t ốt nghi ệp \nHạng m ục Yêu cầu \nĐăng ký h ọc\
17
+ \ tập cho h ọc kỳ 1 Được xếp lớp học theo quy đ ịnh tại Bảng 3.1 Đăng ký h ọc\
18
+ \ tập cho h ọc kỳ 2 \nĐăng ký h ọc tập cho h ọc kỳ 3 Sinh viên ph ải đăng ký h\
19
+ \ ọc song hành h ọc phần FL1133 \nTiếng Anh cơ sở 3 nếu chưa học hoặc chưa được\
20
+ \ miễn. \nĐăng ký h ọc tập cho h ọc kỳ 4 Sinh viên ph ải đăng ký h ọc song hành\
21
+ \ h ọc phần FL113 4 \nTiếng Anh cơ s ở 4 nếu chưa học hoặc chưa được miễn."
22
+ sentences:
23
+ - "ĐỐI VỚI CÁC CHƯƠNG TRÌNH TIÊN TI ẾN (ELITECH) TĂNG CƯ ỜNG NGO ẠI NG Ữ VÀ CTĐT\
24
+ \ H ỢP TÁC QU ỐC TẾ \nCÓ NGO ẠI NG Ữ CHÍNH LÀ TI ẾNG ANH \n(Kèm theo Quy ết\
25
+ \ định số /QĐ-ĐHBK ngày tháng năm 2025 của Giám đ ốc Đại\
26
+ \ học Bách khoa Hà N ội) \nBảng 4.1 Danh m ục các h ọc phần tiếng Anh thu ộc khối\
27
+ \ ngo ại ngữ cơ bản và đi ều kiện mi ễn học \n(Bảng 4.1 này không áp d ụng với\
28
+ \ CTĐT hợp tác v ới Đại học TROY, Hoa K ỳ) \nTT Mã h ọc \nphần Tên h ọc phần\
29
+ \ Thời lượng Học phần đư ợc miễn và học kỳ xếp lớp học \nNhóm 1 Nhóm 2 Nhóm 3\
30
+ \ Nhóm 4 \n1 FL1211 Listening 1 3(3-1-0-6) \nKỳ 1 M M M \n2 FL1212 Speaking\
31
+ \ 1 3(3-1-0-6) M M M \n3 FL1213 Reading 1 3(3-0-0-6) M M M \n4 FL1214 Writing\
32
+ \ 1 3(3-1-0-6) M M M \n5 FL1221 Listening 2 2(2-1-0-4) \nKỳ 2 Kỳ 1 M M \n6\
33
+ \ FL1222 Speaking 2 1(1-1-0-4) M M"
34
+ - "học phần bắt buộc. Lộ trình học tập đối với các học phần ngoại ngữ được quy định\
35
+ \ như \nsau: \n \n \n3 \n a. Ban Đào tạo sẽ đăng ký các học phần ngoại ngữ đối\
36
+ \ với 2 học kỳ đầu cho sinh \nviên dựa theo kết quả phân loại trình độ ngoại ngữ\
37
+ \ đầu v ào. \nb. Học kỳ thứ 3: dành cho sinh viên để tự đăng ký học lại các học\
38
+ \ phần ngoại ngữ \nkhông đạt ở 2 học kỳ đầu (nếu có) và chủ động thi chứng chỉ\
39
+ \ ngoại ngữ. \nc. Từ kỳ thứ 4 trở đi: Ban Đào tạo sẽ thực hiện việc đăng ký\
40
+ \ bắt buộc các học phần \nngoại ngữ đối với các sinh viên không đạt chuẩn ngoại\
41
+ \ ngữ theo số lượng tín chỉ tích lũy . \n2. Trong quá trình học tập, nếu sinh\
42
+ \ viên đạt được chứng chỉ ngoại ngữ theo qu y \nđịnh sẽ được xét miễn các học\
43
+ \ phần ngoại ngữ tương ứng với trình độ đạt được. Các học"
44
+ - "d) Phòng Tài chính-Kế toán chủ trì xây dựng định mức kinh phí hỗ trợ xây dựng\
45
+ \ bài\r\ngiảng B-Learning theo đặt hàng của Trường và thực hiện các thủ tục tài\
46
+ \ chính có liên quan.\r\n\r\nđ) Phòng Tô chức cán bộ chủ trì, phối hợp với Phòng\
47
+ \ Đào tạo thực hiện đánh giá, xét\r\nduyệt khen thưởng giảng viên thực hiện B-Learning\
48
+ \ hiệu quả theo từng năm học.\r\n\r\nĐiều 9. Hiệu lực thi hành\r\n\r\nQuy định\
49
+ \ này được áp dụng từ học kỳ 2 năm học 2020-2021. Các quy định trước đây\r\ntrái\
50
+ \ với Quy định này đều bị bãi bỏ.\r\n\r\nIỀU TRƯỞNG ư\r\n\r\nĐà TRƯỞNG\r\n\r\n\
51
+ \f` PHỤ LỤC\r\n(kèm Quy định về tổ chức hoạt. động đạy-học trên nên tảng công\
52
+ \ nghệ kết nội và Irực IHUÊN,\r\nbạn hành theo Quyêt định số 1315/QÐ-ĐHBK-ĐT ngày\
53
+ \ 29 tháng 6 năm 2021 của Hiệu\r\ntrưởng Trường Đại học Bách khoa Hà nội)"
54
+ - source_sentence: 'Căn cứ Quy chế đào tạo theo Quyết định số 5445/QĐ-ĐHBK ngày 28
55
+ tháng 5 năm 2025;
56
+
57
+ Căn cứ Quyết định số 126/QĐ-ĐHBK ngày 07 tháng 01 năm 2025 về bảng quy đổi chứng
58
+ chỉ ngoại ngữ;
59
+
60
+ Căn cứ Tờ trình số 106/TTr-ĐT ngày 12 tháng 9 năm 2025;
61
+
62
+ Theo đề nghị của Trưởng ban Ban Đào tạo;
63
+
64
+ QUYẾT ĐỊNH:
65
+
66
+ Điều 1. Ban hành kèm theo Quyết định này Quy định về phân loại trình độ đầu vào,
67
+ chương trình ngoại ngữ cơ bản và chuẩn ngoại ngữ yêu cầu đối với sinh viên đại
68
+ học hình thức chính quy của Đại học Bách khoa Hà Nội.
69
+
70
+ Điều 2. Các đơn vị liên quan chịu trách nhiệm thi hành Quyết định này.
71
+
72
+ KT. GIÁM ĐỐC
73
+
74
+ PHÓ GIÁM ĐỐC
75
+
76
+ PGS.TS. Nguyễn Phong Điền
77
+
78
+ QUY ĐỊNH Về phân loại trình độ đầu vào, chương trình ngoại ngữ cơ bản và chuẩn
79
+ ngoại ngữ yêu cầu đối với sinh viên đại học hình thức chính quy'
80
+ sentences:
81
+ - "3. Tự nguyện thôi học: Sin h viên thấy không có đủ điều kiện hoặc không muốn\
82
+ \ \ntiếp tục học tại ĐHBK Hà Nội có thể làm đơn đề n ghị thôi học và đượ c xem\
83
+ \ xét cho \nthôi học. Sinh viên đã có quyết định cho thôi học không được tiếp\
84
+ \ nh ận trở lại. \nĐiều 17. Chuyển chương trình đào tạo, hình th ức đào t ạo\
85
+ \ \n1. Sinh viên hoàn thành năm học thứ nhất được xem xét chuyển sang học một\
86
+ \ \nCTĐT khác nếu đáp ứng đầy đủ các điều kiện sau: \na) Đáp ứng điều kiện\
87
+ \ trúng tuyển của CTĐT muốn chuyển sang học ; \nb) Có số TC tích lũy t ối thiểu\
88
+ \ bằng khối lượng thiết kế theo kế hoạch học tập \nchuẩn của CTĐT và không\
89
+ \ bị điểm F ; \nc) Xếp loại học lực căn cứ theo điểm trung b ình tích lũy (CPA)\
90
+ \ đạt từ loại khá trở \nlên; \nd) Không bị cảnh báo học tập hoặc bị xét thi hành\
91
+ \ kỷ luật ;"
92
+ - '2. Với CTĐT có ngoại ngữ chính khác tiếng Anh: phân loại dựa trên chứng chỉ quốc
93
+ tế tương ứng.
94
+
95
+ 3. Sinh viên được xét miễn học phần NNCB và xếp lớp phù hợp theo kết quả phân
96
+ loại.
97
+
98
+ 4. Sinh viên không đủ điều kiện phân loại sẽ học từ học phần đầu tiên của khối
99
+ NNCB.
100
+
101
+ Điều 3. Công nhận, xét miễn học phần ngoại ngữ cơ bản
102
+
103
+ 1. Các học phần NNCB thuộc khối kiến thức bổ trợ, không tính tín chỉ chính khóa.
104
+
105
+ 2. Sinh viên có chứng chỉ đạt yêu cầu sẽ được miễn học phần tương ứng (ghi điểm
106
+ R).
107
+
108
+ 3. Chứng chỉ phải còn hạn tại thời điểm nộp đơn xét miễn.
109
+
110
+ 4. Chứng chỉ phải được thẩm định và cập nhật lên hệ thống trước khi nộp đơn.
111
+
112
+ 5. Hạn nộp đơn xét miễn: muộn nhất 2 tuần trước khi bắt đầu học kỳ.
113
+
114
+ Điều 4. Lộ trình học tập các học phần ngoại ngữ cơ bản
115
+
116
+ 1. Học kỳ 1–2: xếp lớp theo kết quả phân loại.'
117
+ - "2. Phòng Hợp tác đối ngoại có các nhiệm vụ: cung cấp thông tin cho người học\r\
118
+ \nvề các chương trình trao đổi, hợp tác về đào tạo, thực tập, nghiên cứu tại nước\
119
+ \ ngoài; là\r\nđầu mối liên hệ, hỗ trợ thủ tục, đánh giá hồ sơ đăng ký học tập,\
120
+ \ nghiên cứu, thực tập tại\r\nnước ngoài theo các chương trình trao đổi, hợp tác\
121
+ \ của Trường; ; thông kê số liệu và lập\r\nbáo cáo kết quá thực hiện.\r\n\r\n\
122
+ 3. Phòng Đào tạo có các nhiệm vụ: Tư vấn, hướng dẫn về quy định và quy irình\r\
123
+ \ncông nhận tín chỉ; duyệt kế hoạch học tập và trình Hiệu trưởng ký quyết định\
124
+ \ cho phép\r\nngười học được học (tập, nghiên cứu ở đơn vị đôi tác; thực hiện\
125
+ \ các thủ tục để công nhận\r\ntín chỉ và chuyển đổi kết quả tương đương.\r\n\f\
126
+ 4. Phòng Công tác sinh viên có các nhiệm vụ: cung cấp thông tin cho người học"
127
+ - source_sentence: 'to the standard study plan or their personalized study plan. This
128
+ phase \ntypically takes place in the first few weeks of the preceding semester.
129
+ Based on the number of students \nregistered, HUST determines how many class
130
+ es are in need to open and then publishes the schedule. \nb) Official class registration:
131
+ Students select specific classes for the courses they registered for. \nFor courses
132
+ that include multiple components (lectures, exercises, practical classes , labs
133
+ , etc.), \nstudents must register for all required components. \nc) Registration
134
+ adjustment: Students can change classes, cancel classes, or add new classes,
135
+ \nincluding courses which are not previously registered. Each main semester
136
+ includes two adjustment \nperiods which end before the semester begins.'
137
+ sentences:
138
+ - "Điều 12. Ý kiến phản hồi của người học, đánh giá kết quả học tập ............................\
139
+ \ 9 \nĐiều 13. Đồ án/khóa luận tốt nghiệp đại học ................................\
140
+ \ ............................ 10 \nĐiều 14. Đăng ký tốt nghiệp đại học ................................\
141
+ \ ................................ ......... 11 \nĐiều 15. Điểm trung bình toàn\
142
+ \ khóa và hạng tốt nghiệp đại học .............................. 12 \nĐiều 16.\
143
+ \ Nghỉ học tạm thời và tự nguyện thôi học ................................ ...................\
144
+ \ 12 \nĐiều 17. Chuyển chương trình đào tạo, hình thức đào tạo ................................\
145
+ \ ........ 13 \nĐiều 18. Học cùng lúc hai chương trình ................................\
146
+ \ ................................ .... 14"
147
+ - 'needs updating or \nadding , and the requirements of the field and research topic.
148
+ A minimum of 4 supplementary credits , \nequivalent to 2 courses, is required. \nb)
149
+ For candidates without a master’s degree: supplementary courses include all courses
150
+ in a \nresearch -oriented master’s program in the relevant field, excluding the
151
+ master''s thesis. \nc) Doctoral c andidates must take supplementary courses within
152
+ the program s (undergraduate or \nmaster’s levels ) they are in and attend the
153
+ corresponding classes of that program. \n2. Doctoral courses aim to deepen theoretical
154
+ understanding, update the latest knowledge in the \nfield, develop research methodology,
155
+ and improve the application of research methods in the chosen \nresearch area
156
+ or topic. \na) Each candidate must complete a'
157
+ - 'as stipulated in Clause 2, Article 19 of these \nRegulations are eligible to
158
+ register for a limited credit load. \n3. After the registration adjustment
159
+ period, students may request to withdraw from a course , then \nthe grade of
160
+ that course is not calculated. \n4. For in -class courses, a class is only opened if
161
+ there is a minimum of 20 students register . \nExceptions are handled as follows: \na)
162
+ Consider opening classes for ELITECH majors or programs with a small number
163
+ of students, \nin order to maximize support for students following the standard
164
+ academic plan. \n 10 \n \n b) Consider opening classes for 5 to 19 registered
165
+ students, based on student requests, with \ntuition fees adjusted according to
166
+ the applicable multiplier as regulated. \nc) Consider opening'
167
+ - source_sentence: 'Số tín chỉ tích lũy: .........................................................;
168
+ Điểm CPA: .............................
169
+
170
+ Đã có chứng chỉ ngoại ngữ (phù hợp với yêu cầu của chương trình học bổng): .............
171
+
172
+ ...........................................................................................................................................
173
+
174
+ Tóm tắt các thành tích (cao nhất) đạt được trong học tập, NCKH tại ĐHBK Hà Nội:
175
+
176
+ ...........................................................................................................................................
177
+
178
+ ...........................................................................................................................................'
179
+ sentences:
180
+ - 'Đăng ký thi bù do hoãn thi
181
+
182
+ Đăng ký thi bù do hoãn thi cuối kỳ https://forms.office.com/r/QTh54tSjhm
183
+
184
+ (Cần đăng ký muộn nhất là 5 ngày trước ngày thi)
185
+
186
+ Nếu có thắc mắc liên hệ chuyên viên Trần Thị Hạnh: hanh.tranthi@hust.edu.vn
187
+
188
+ Hướng dẫn chi tiết xem https://husteduvn.sharepoint.com/:w:/s/NguyenXuanTung_PDT/EVmtZeRjgWFHi1FAXc42E50B7c_DwLLU5Kk_qSP0P__V-A?e=ihKYj7
189
+
190
+ Đăng ký bù do hoãn thi cuối kỳ https://forms.office.com/r/QTh54tSjhm
191
+
192
+ 32. Reset mật khẩu tài khoản ctt-sis.hust.edu.vn
193
+
194
+ Hiện tại đã mở thêm chức năng đăng nhập bằng tài khoản email Office 365, do đó
195
+ trong trường hợp quên mật khẩu thì SV sẽ dùng tài khoản email.
196
+
197
+ Thắc mắc về tài khoản Office 365: liên hệ Trung tâm Chuyển đổi số
198
+
199
+ Văn phòng: 905A - TV Tạ Quang Bửu
200
+
201
+ Điện thoại: 024 38682203
202
+
203
+ Email: office.cdt@hust.edu.vn'
204
+ - 'Điều 10. Phòng Đào tạo: quản lý học tập, hỗ trợ thủ tục, tổ chức phụ đạo.
205
+
206
+ Điều 11. Phòng Hợp tác đối ngoại: quản lý hồ sơ LHS trao đổi, tổ chức giao lưu,
207
+ hỗ trợ thị thực.
208
+
209
+ Điều 12. Đơn vị hỗ trợ học thuật: phối hợp tổ chức giao lưu văn hóa.
210
+
211
+ Điều 13. Phòng Công tác sinh viên:
212
+
213
+ - Quản lý hồ sơ, phổ biến quy định, hỗ trợ hành chính, tổ chức hoạt động giao
214
+ lưu, cập nhật dữ liệu, báo cáo.
215
+
216
+ Điều 14. Đơn vị đào tạo: bố trí cố vấn, hướng dẫn học tập, báo cáo tình hình học
217
+ tập.
218
+
219
+ Điều 15. Đoàn Thanh niên và Hội Sinh viên: tổ chức giao lưu, chọn sinh viên hỗ
220
+ trợ LHS.
221
+
222
+ Chương IV: ĐIỀU KHOẢN THI HÀNH
223
+
224
+ Điều 16. Tổ chức thực hiện: các đơn vị thực hiện theo chức năng, báo cáo vướng
225
+ mắc về CTSV.
226
+
227
+ Điều 17. Hiệu lực: có hiệu lực từ ngày ký, các quy định trước đây trái với văn
228
+ bản này hết hiệu lực.'
229
+ - '...........................................................................................................................................
230
+
231
+ Tóm tắt các thành tích (cao nhất) đạt được trong hoạt động phong trào Đoàn- Hội
232
+ tại
233
+
234
+ ĐHBK Hà Nội (nếu có): ...................................................................................................
235
+
236
+ ...........................................................................................................................................
237
+
238
+ ...........................................................................................................................................
239
+
240
+ 2. Chương trình trao đổi đăng ký tham gia:
241
+
242
+ a) Tên Chương trình trao đổi: ...........................................................................................'
243
+ - source_sentence: '............... 22 \nArticle 34. Master''s degree requirements
244
+ and graduation classifications. ....... 22 \nArticle 35. Temporary leave and
245
+ academic record retention ........................... 23 \nArticle 36. Extension
246
+ of study period and withdrawal from study .................. 24 \nCHAPTER V
247
+ : DOCTORAL PROGRAMS ................................ .................... 25
248
+ \nArticle 37. Planning and progress reporting ................................
249
+ .................... 25 \nArticle 38. Supplementary courses and doctoral courses ................................
250
+ . 25 \nArticle 39. Literature review and doctoral thematic studies ............................ 26
251
+ \nArticle 40. Doctoral dissertation ................................ ................................
252
+ ...... 26'
253
+ sentences:
254
+ - "Điều 45. Công nh ận và chuy ển đổi kết quả học tập, nghiên c ứu ..............................\
255
+ \ 27 \nCHƯƠNG VI T Ổ CHỨC TH ỰC HI ỆN ................................ ................................\
256
+ \ ....... 28 \nĐiều 46. Quy định chuy ển tiếp ................................\
257
+ \ ................................ .................. 28 \nĐiều 47. Hi ệu lực\
258
+ \ thi hành ................................ ................................\
259
+ \ ......................... 28 \nBỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HỘI CHỦ\
260
+ \ NGHĨA VIỆT NAM \nĐẠI HỌC BÁCH KHOA HÀ NỘI \n Độc lập – Tự do – Hạnh phúc\
261
+ \ \n \n \nQUY CHẾ ĐÀO T ẠO \n(Ban hành kèm theo Quyết định số 4600 /QĐ–ĐHBK\
262
+ \ ngày 09 tháng 6 năm 202 3 \ncủa Giám đốc Đại học Bách khoa Hà Nội) \n\
263
+ \ \nCHƯƠNG I \nNHỮNG QUY Đ ỊNH CHUNG"
264
+ - "4. Hoàn thành nghĩa vụ nộp học phí đối với học phần được công nhận tín chỉ theo\r\
265
+ \nmức học phí tương ứng của Trường.\r\n\r\nĐiều 5. Tô chức thực biện\r\n\r\n1.\
266
+ \ Các đơn vị chuyên môn khoa/viện có các nhiệm vụ: thông tin đầy đủ về các\r\n\
267
+ chương trình hợp tác, khóa học ngoài Trường tới người học thuộc đơn vị quản lý;\
268
+ \ chọn\r\nlựa ứng viên đáp ứng đủ điều kiện tham gia; hỗ trợ, tự vẫn người học\
269
+ \ chọn lựa nội dung\r\nhọc tập/nghiên cứu, xây dựng kế hoạch thực hiện; tổ chức\
270
+ \ cho người học báo cáo kết\r\nquả học tập, nghiên cứu; tổ chức xét duyệt công\
271
+ \ nhận tín chỉ đối với các học phần có\r\nliên quan; hỗ trợ người học hoàn thành\
272
+ \ thủ tục công nhận tín chỉ.\r\n\r\n2. Phòng Hợp tác đối ngoại có các nhiệm vụ:\
273
+ \ cung cấp thông tin cho người học"
274
+ - '30 \nCHAPTER VI : ORGANIZATION AND IMPLEMENTATION ................. 32 \nArticle
275
+ 47. Transitional provisions ................................ ................................
276
+ ... 32 \nArticle 48. Commencement ................................ ................................
277
+ .............. 32 \n \n \n 1 \n \nMINISTRY OF EDUCATION AND TRANING \nHANOI
278
+ UNIVERSITY OF SCIENCE AND \nTECHNOLOGY SOCIALIST REPUBLIC OF VIETNAM \nIndependence
279
+ - Freedom - Happiness \n \n \nACADEMIC REGULATIONS \n(Issued together with Decision
280
+ No. 5445/QĐ -ĐHBK, dated 28/05/2025 \nby the President of Hanoi University of
281
+ Science and Technology) \nCHAPTER I \nGENERAL PROVISIONS \nArticle 1. Scope
282
+ and Applicability \n1. These regulations govern the training activities for full
283
+ -time and part -time/in'
284
+ pipeline_tag: sentence-similarity
285
+ library_name: sentence-transformers
286
+ ---
287
+
288
+ # SentenceTransformer based on keepitreal/vietnamese-sbert
289
+
290
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [keepitreal/vietnamese-sbert](https://huggingface.co/keepitreal/vietnamese-sbert). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
291
+
292
+ ## Model Details
293
+
294
+ ### Model Description
295
+ - **Model Type:** Sentence Transformer
296
+ - **Base model:** [keepitreal/vietnamese-sbert](https://huggingface.co/keepitreal/vietnamese-sbert) <!-- at revision a9467ef2ef47caa6448edeabfd8e5e5ce0fa2a23 -->
297
+ - **Maximum Sequence Length:** 256 tokens
298
+ - **Output Dimensionality:** 768 dimensions
299
+ - **Similarity Function:** Cosine Similarity
300
+ <!-- - **Training Dataset:** Unknown -->
301
+ <!-- - **Language:** Unknown -->
302
+ <!-- - **License:** Unknown -->
303
+
304
+ ### Model Sources
305
+
306
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
307
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
308
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
309
+
310
+ ### Full Model Architecture
311
+
312
+ ```
313
+ SentenceTransformer(
314
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False, 'architecture': 'RobertaModel'})
315
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
316
+ )
317
+ ```
318
+
319
+ ## Usage
320
+
321
+ ### Direct Usage (Sentence Transformers)
322
+
323
+ First install the Sentence Transformers library:
324
+
325
+ ```bash
326
+ pip install -U sentence-transformers
327
+ ```
328
+
329
+ Then you can load this model and run inference.
330
+ ```python
331
+ from sentence_transformers import SentenceTransformer
332
+
333
+ # Download from the 🤗 Hub
334
+ model = SentenceTransformer("hungq/hust_sbert_2")
335
+ # Run inference
336
+ sentences = [
337
+ "............... 22 \\nArticle 34. Master's degree requirements and graduation classifications. ....... 22 \\nArticle 35. Temporary leave and academic record retention ........................... 23 \\nArticle 36. Extension of study period and withdrawal from study .................. 24 \\nCHAPTER V : DOCTORAL PROGRAMS ................................ .................... 25 \\nArticle 37. Planning and progress reporting ................................ .................... 25 \\nArticle 38. Supplementary courses and doctoral courses ................................ . 25 \\nArticle 39. Literature review and doctoral thematic studies ............................ 26 \\nArticle 40. Doctoral dissertation ................................ ................................ ...... 26",
338
+ '30 \\nCHAPTER VI : ORGANIZATION AND IMPLEMENTATION ................. 32 \\nArticle 47. Transitional provisions ................................ ................................ ... 32 \\nArticle 48. Commencement ................................ ................................ .............. 32 \\n \\n \\n 1 \\n \\nMINISTRY OF EDUCATION AND TRANING \\nHANOI UNIVERSITY OF SCIENCE AND \\nTECHNOLOGY SOCIALIST REPUBLIC OF VIETNAM \\nIndependence - Freedom - Happiness \\n \\n \\nACADEMIC REGULATIONS \\n(Issued together with Decision No. 5445/QĐ -ĐHBK, dated 28/05/2025 \\nby the President of Hanoi University of Science and Technology) \\nCHAPTER I \\nGENERAL PROVISIONS \\nArticle 1. Scope and Applicability \\n1. These regulations govern the training activities for full -time and part -time/in',
339
+ 'Điều 45. Công nh ận và chuy ển đổi kết quả học tập, nghiên c ứu .............................. 27 \nCHƯƠNG VI T Ổ CHỨC TH ỰC HI ỆN ................................ ................................ ....... 28 \nĐiều 46. Quy định chuy ển tiếp ................................ ................................ .................. 28 \nĐiều 47. Hi ệu lực thi hành ................................ ................................ ......................... 28 \nBỘ GIÁO DỤC VÀ ĐÀO TẠO CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM \nĐẠI HỌC BÁCH KHOA HÀ NỘI \n Độc lập – Tự do – Hạnh phúc \n \n \nQUY CHẾ ĐÀO T ẠO \n(Ban hành kèm theo Quyết định số 4600 /QĐ–ĐHBK ngày 09 tháng 6 năm 202 3 \ncủa Giám đốc Đại học Bách khoa Hà Nội) \n \nCHƯƠNG I \nNHỮNG QUY Đ ỊNH CHUNG',
340
+ ]
341
+ embeddings = model.encode(sentences)
342
+ print(embeddings.shape)
343
+ # [3, 768]
344
+
345
+ # Get the similarity scores for the embeddings
346
+ similarities = model.similarity(embeddings, embeddings)
347
+ print(similarities)
348
+ # tensor([[1.0000, 0.7949, 0.7070],
349
+ # [0.7949, 1.0000, 0.7457],
350
+ # [0.7070, 0.7457, 1.0000]])
351
+ ```
352
+
353
+ <!--
354
+ ### Direct Usage (Transformers)
355
+
356
+ <details><summary>Click to see the direct usage in Transformers</summary>
357
+
358
+ </details>
359
+ -->
360
+
361
+ <!--
362
+ ### Downstream Usage (Sentence Transformers)
363
+
364
+ You can finetune this model on your own dataset.
365
+
366
+ <details><summary>Click to expand</summary>
367
+
368
+ </details>
369
+ -->
370
+
371
+ <!--
372
+ ### Out-of-Scope Use
373
+
374
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
375
+ -->
376
+
377
+ <!--
378
+ ## Bias, Risks and Limitations
379
+
380
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
381
+ -->
382
+
383
+ <!--
384
+ ### Recommendations
385
+
386
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
387
+ -->
388
+
389
+ ## Training Details
390
+
391
+ ### Training Dataset
392
+
393
+ #### Unnamed Dataset
394
+
395
+ * Size: 2,857 training samples
396
+ * Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code>
397
+ * Approximate statistics based on the first 1000 samples:
398
+ | | sentence_0 | sentence_1 | label |
399
+ |:--------|:------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|:-----------------------------------------------------------------|
400
+ | type | string | string | float |
401
+ | details | <ul><li>min: 3 tokens</li><li>mean: 210.83 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 3 tokens</li><li>mean: 210.16 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 0.64</li><li>mean: 0.75</li><li>max: 0.86</li></ul> |
402
+ * Samples:
403
+ | sentence_0 | sentence_1 | label |
404
+ |:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
405
+ | <code>Sinh viên được công nhận tốt nghiệp cử nhân sẽ được cấp bằng cử nhân và chính thức chuyển sang học CTĐT KS 180 TC. Các học phần tích lũy trước sẽ được xét công nhận thuộc CTĐT KS.<br>4. Điểm trung bình toàn khóa và hạng tốt nghiệp kỹ sư:<br>Điểm học phần bậc KS không dùng để xét học bổng khuyến khích học tập ở bậc cử nhân.<br>Điểm trung bình toàn khóa và hạng tốt nghiệp kỹ sư theo quy chế hiện hành.<br>Điểm trung bình toàn khóa là trung bình tích lũy của cả giai đoạn cử nhân và kỹ sư, tính theo trọng số tín chỉ từng giai đoạn.<br>Người học hoàn thành đủ học phần và đạt chứng chỉ ngoại ngữ tối thiểu B2 sẽ được cấp bằng kỹ sư chuyên sâu đặc thù trình độ Bậc 7 theo Khung trình độ quốc gia Việt Nam.<br>5. Thông tin trên hệ thống quản lý học tập:<br>Khi sinh viên được công nhận tốt nghiệp cử nhân:</code> | <code>Theo đề nghị của Trưởng Phòng Đào tạo;<br>QUYẾT ĐỊNH:<br>Điều 1. Ban hành kèm theo Quyết định này Quy định công nhận tín chỉ và chuyển đổi kết quả học phần tương đương của Trường ĐHBK Hà Nội.<br>Điều 2. Quyết định này có hiệu lực kể từ ngày ký và áp dụng từ năm học 2021–2022.<br>Điều 3. Các đơn vị liên quan và người học chịu trách nhiệm thi hành Quyết định này.<br>KT. HIỆU TRƯỞNG<br>PHÓ HIỆU TRƯỞNG<br>PGS.TS. Nguyễn Phong Điền<br>QUY ĐỊNH Về chuyển đổi kết quả học phần tương đương và công nhận tín chỉ tích lũy<br>(Ban hành kèm theo Quyết định số 1933/QĐ-ĐHBK-ĐT ngày 08/9/2021)<br>Điều 1. Phạm vi điều chỉnh và đối tượng áp dụng<br>1. Quy định về tiêu chuẩn, thủ tục chuyển đổi kết quả học tập tương đương và công nhận tín chỉ tích lũy.</code> | <code>0.6376281516217733</code> |
406
+ | <code>b) Học bổng từ các nguồn hợp tác quốc tế song phương và đa phương:<br><br>Ngoài nguồn học bổng do Đại học cấp, mỗi năm sinh viên ĐHBK Hà Nội còn nhận được hàng trăm suất học bổng tài trợ cho sinh viên sang học tập, thực tập tại nước ngoài từ các nguồn hợp tác quốc tế song phương và đa phương của ĐHBK Hà Nội. Chi tiết các chương trình học bổng tài trợ này sinh viên theo dõi https://www.hust.edu.vn/vi/su-kien-noi-bat/hop-tac-doi-ngoai-truyen-thong/<br><br>5.Học bổng gắn kết quê hương</code> | <code>5.Học bổng gắn kết quê hương<br><br>Nhằm gắn kết quá trình đào tạo, NCKH với hoạt động kinh doanh, sản xuất, năm 2024 ĐHBK Hà Nội sẽ dành 2 tỷ đồng để cấp Học bổng gắn kết quê hương cho sinh viên, học viên chương trình kỹ sư chuyên sâu đặc thù có đồ án/khóa luận tốt nghiệp (ĐANT) góp phần cải tiến, nâng cao chất lượng, hiệu quả kinh doanh, sản xuất hoặc chất lượng các dịch vụ an sinh xã hội tại quê hương của sinh viên/học viên.<br><br>Mức học bổng: Học bổng có trị giá 5 triệu đồng/ĐATN.<br><br>- Kế hoạch, hồ sơ đăng ký xét cấp HB Gắn kết quê hương học kỳ 2 năm học 2024-2025 xem https://ctt.hust.edu.vn/DisplayWeb/DisplayBaiViet?baiviet=44531<br><br>- Kế hoạch, hồ sơ đăng ký xét cấp HB Gắn kết quê hương học kỳ 1 năm học 2024-2025 xem https://ctt.hust.edu.vn/DisplayWeb/DisplayBaiViet?baiviet=43461</code> | <code>0.8607079764250578</code> |
407
+ | <code>thuộc diện miễn làm ngh ĩa vụ quân sự theo quy định hiện hành; <br>c) Học sinh, sinh viên đã hoàn thành ngh ĩa vụ quân sự, công an nhân dân. <br>4. Đối tượng được tạm hoãn học môn học GDQP&AN: <br>a) Học sinh, sinh viên vì lý do s ức khỏe phải dừng học trong th ời gian dài để <br>điều trị, phải có giấy xác nhận của bệnh viện nơi học sinh, sinh viên điều trị; <br>b) Học sinh, sinh viên là n ữ đang mang thai ho ặc trong th ời gian ngh ỉ chế độ <br>thai sản theo quy định hiện hành. <br>5. Giám đốc, hiệu trưởng các cơ sở giáo dục xem xét t ạm hoãn h ���c môn học <br>GDQP&AN cho các đối tượng quy định tại điểm a, điểm b khoản 4 Điều này. Hết <br>thời gian tạm hoãn, các c ơ sở giáo dục bố trí cho h ọc sinh, sinh viên vào h ọc các <br>lớp phù hợp để hoàn thành ch ương trình. <br>Điều 5. Giáo viên, gi ảng viên GDQP&AN</code> | <code>lớp phù hợp để hoàn thành ch ương trình. <br>Điều 5. Giáo viên, gi ảng viên GDQP&AN <br>1. Giáo viên, gi ảng viên GDQP&AN bao g ồm giáo viên, gi ảng viên có trình độ <br>chuẩn theo quy định tại khoản 1 và kho ản 2 Điều 6 Nghị định số 13/2014/N Đ-CP <br>ngày 25 tháng 02 n ăm 2014 c ủa Chính ph ủ quy định chi tiết và biện pháp thi hành <br>Luật Giáo dục quốc phòng và an ninh. <br>2. Các cơ sở giáo dục xây dựng kế hoạch đào tạo, bồi dưỡng, cập nhật kiến <br>thức quốc phòng và an ninh, ph ương pháp d ạy học bảo đảm trình độ chuẩn phù <br>hợp với yêu cầu giảng dạy ở từng trình độ đào tạo. <br>Điều 6. Quản lý giáo viên, gi ảng viên GDQP&AN <br>Các cơ sở giáo dục thực hiện quản lý đội ngũ giáo viên, gi ảng viên GDQP&AN <br>như giáo viên, gi ảng viên môn h ọc khác. Gi ảng viên GDQP&AN là s ĩ quan quân</code> | <code>0.8607079764250578</code> |
408
+ * Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
409
+ ```json
410
+ {
411
+ "loss_fct": "torch.nn.modules.loss.MSELoss"
412
+ }
413
+ ```
414
+
415
+ ### Training Hyperparameters
416
+ #### Non-Default Hyperparameters
417
+
418
+ - `per_device_train_batch_size`: 16
419
+ - `per_device_eval_batch_size`: 16
420
+ - `num_train_epochs`: 1
421
+ - `multi_dataset_batch_sampler`: round_robin
422
+
423
+ #### All Hyperparameters
424
+ <details><summary>Click to expand</summary>
425
+
426
+ - `overwrite_output_dir`: False
427
+ - `do_predict`: False
428
+ - `eval_strategy`: no
429
+ - `prediction_loss_only`: True
430
+ - `per_device_train_batch_size`: 16
431
+ - `per_device_eval_batch_size`: 16
432
+ - `per_gpu_train_batch_size`: None
433
+ - `per_gpu_eval_batch_size`: None
434
+ - `gradient_accumulation_steps`: 1
435
+ - `eval_accumulation_steps`: None
436
+ - `torch_empty_cache_steps`: None
437
+ - `learning_rate`: 5e-05
438
+ - `weight_decay`: 0.0
439
+ - `adam_beta1`: 0.9
440
+ - `adam_beta2`: 0.999
441
+ - `adam_epsilon`: 1e-08
442
+ - `max_grad_norm`: 1
443
+ - `num_train_epochs`: 1
444
+ - `max_steps`: -1
445
+ - `lr_scheduler_type`: linear
446
+ - `lr_scheduler_kwargs`: {}
447
+ - `warmup_ratio`: 0.0
448
+ - `warmup_steps`: 0
449
+ - `log_level`: passive
450
+ - `log_level_replica`: warning
451
+ - `log_on_each_node`: True
452
+ - `logging_nan_inf_filter`: True
453
+ - `save_safetensors`: True
454
+ - `save_on_each_node`: False
455
+ - `save_only_model`: False
456
+ - `restore_callback_states_from_checkpoint`: False
457
+ - `no_cuda`: False
458
+ - `use_cpu`: False
459
+ - `use_mps_device`: False
460
+ - `seed`: 42
461
+ - `data_seed`: None
462
+ - `jit_mode_eval`: False
463
+ - `bf16`: False
464
+ - `fp16`: False
465
+ - `fp16_opt_level`: O1
466
+ - `half_precision_backend`: auto
467
+ - `bf16_full_eval`: False
468
+ - `fp16_full_eval`: False
469
+ - `tf32`: None
470
+ - `local_rank`: 0
471
+ - `ddp_backend`: None
472
+ - `tpu_num_cores`: None
473
+ - `tpu_metrics_debug`: False
474
+ - `debug`: []
475
+ - `dataloader_drop_last`: False
476
+ - `dataloader_num_workers`: 0
477
+ - `dataloader_prefetch_factor`: None
478
+ - `past_index`: -1
479
+ - `disable_tqdm`: False
480
+ - `remove_unused_columns`: True
481
+ - `label_names`: None
482
+ - `load_best_model_at_end`: False
483
+ - `ignore_data_skip`: False
484
+ - `fsdp`: []
485
+ - `fsdp_min_num_params`: 0
486
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
487
+ - `fsdp_transformer_layer_cls_to_wrap`: None
488
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
489
+ - `parallelism_config`: None
490
+ - `deepspeed`: None
491
+ - `label_smoothing_factor`: 0.0
492
+ - `optim`: adamw_torch_fused
493
+ - `optim_args`: None
494
+ - `adafactor`: False
495
+ - `group_by_length`: False
496
+ - `length_column_name`: length
497
+ - `project`: huggingface
498
+ - `trackio_space_id`: trackio
499
+ - `ddp_find_unused_parameters`: None
500
+ - `ddp_bucket_cap_mb`: None
501
+ - `ddp_broadcast_buffers`: False
502
+ - `dataloader_pin_memory`: True
503
+ - `dataloader_persistent_workers`: False
504
+ - `skip_memory_metrics`: True
505
+ - `use_legacy_prediction_loop`: False
506
+ - `push_to_hub`: False
507
+ - `resume_from_checkpoint`: None
508
+ - `hub_model_id`: None
509
+ - `hub_strategy`: every_save
510
+ - `hub_private_repo`: None
511
+ - `hub_always_push`: False
512
+ - `hub_revision`: None
513
+ - `gradient_checkpointing`: False
514
+ - `gradient_checkpointing_kwargs`: None
515
+ - `include_inputs_for_metrics`: False
516
+ - `include_for_metrics`: []
517
+ - `eval_do_concat_batches`: True
518
+ - `fp16_backend`: auto
519
+ - `push_to_hub_model_id`: None
520
+ - `push_to_hub_organization`: None
521
+ - `mp_parameters`:
522
+ - `auto_find_batch_size`: False
523
+ - `full_determinism`: False
524
+ - `torchdynamo`: None
525
+ - `ray_scope`: last
526
+ - `ddp_timeout`: 1800
527
+ - `torch_compile`: False
528
+ - `torch_compile_backend`: None
529
+ - `torch_compile_mode`: None
530
+ - `include_tokens_per_second`: False
531
+ - `include_num_input_tokens_seen`: no
532
+ - `neftune_noise_alpha`: None
533
+ - `optim_target_modules`: None
534
+ - `batch_eval_metrics`: False
535
+ - `eval_on_start`: False
536
+ - `use_liger_kernel`: False
537
+ - `liger_kernel_config`: None
538
+ - `eval_use_gather_object`: False
539
+ - `average_tokens_across_devices`: True
540
+ - `prompts`: None
541
+ - `batch_sampler`: batch_sampler
542
+ - `multi_dataset_batch_sampler`: round_robin
543
+ - `router_mapping`: {}
544
+ - `learning_rate_mapping`: {}
545
+
546
+ </details>
547
+
548
+ ### Framework Versions
549
+ - Python: 3.12.12
550
+ - Sentence Transformers: 5.1.2
551
+ - Transformers: 4.57.1
552
+ - PyTorch: 2.9.0+cu126
553
+ - Accelerate: 1.11.0
554
+ - Datasets: 4.0.0
555
+ - Tokenizers: 0.22.1
556
+
557
+ ## Citation
558
+
559
+ ### BibTeX
560
+
561
+ #### Sentence Transformers
562
+ ```bibtex
563
+ @inproceedings{reimers-2019-sentence-bert,
564
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
565
+ author = "Reimers, Nils and Gurevych, Iryna",
566
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
567
+ month = "11",
568
+ year = "2019",
569
+ publisher = "Association for Computational Linguistics",
570
+ url = "https://arxiv.org/abs/1908.10084",
571
+ }
572
+ ```
573
+
574
+ <!--
575
+ ## Glossary
576
+
577
+ *Clearly define terms in order to be accessible across audiences.*
578
+ -->
579
+
580
+ <!--
581
+ ## Model Card Authors
582
+
583
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
584
+ -->
585
+
586
+ <!--
587
+ ## Model Card Contact
588
+
589
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
590
+ -->
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "<mask>": 64000
3
+ }
bpe.codes ADDED
The diff for this file is too large to render. See raw diff
 
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "RobertaModel"
4
+ ],
5
+ "attention_probs_dropout_prob": 0.1,
6
+ "bos_token_id": 0,
7
+ "classifier_dropout": null,
8
+ "dtype": "float32",
9
+ "eos_token_id": 2,
10
+ "gradient_checkpointing": false,
11
+ "hidden_act": "gelu",
12
+ "hidden_dropout_prob": 0.1,
13
+ "hidden_size": 768,
14
+ "initializer_range": 0.02,
15
+ "intermediate_size": 3072,
16
+ "layer_norm_eps": 1e-05,
17
+ "max_position_embeddings": 258,
18
+ "model_type": "roberta",
19
+ "num_attention_heads": 12,
20
+ "num_hidden_layers": 12,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "tokenizer_class": "PhobertTokenizer",
24
+ "transformers_version": "4.57.1",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 64001
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "5.1.2",
4
+ "transformers": "4.57.1",
5
+ "pytorch": "2.9.0+cu126"
6
+ },
7
+ "model_type": "SentenceTransformer",
8
+ "prompts": {
9
+ "query": "",
10
+ "document": ""
11
+ },
12
+ "default_prompt_name": null,
13
+ "similarity_fn_name": "cosine"
14
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0a7c737dac82cd127be7d6f5c63bfd9bce57f8143bf99b05cd6ba500cbdf24d3
3
+ size 540015464
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": "<s>",
3
+ "cls_token": "<s>",
4
+ "eos_token": "</s>",
5
+ "mask_token": "<mask>",
6
+ "pad_token": "<pad>",
7
+ "sep_token": "</s>",
8
+ "unk_token": "<unk>"
9
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "64000": {
36
+ "content": "<mask>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": false,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "extra_special_tokens": {},
49
+ "mask_token": "<mask>",
50
+ "model_max_length": 256,
51
+ "pad_token": "<pad>",
52
+ "sep_token": "</s>",
53
+ "tokenizer_class": "PhobertTokenizer",
54
+ "unk_token": "<unk>"
55
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff