File size: 35,444 Bytes
937f1c5
 
 
 
 
 
426f3e2
937f1c5
 
 
c107e56
 
937f1c5
c107e56
 
 
 
 
937f1c5
c107e56
 
937f1c5
c107e56
937f1c5
 
c107e56
 
 
937f1c5
c107e56
 
 
 
937f1c5
c107e56
 
937f1c5
 
c107e56
 
 
 
 
 
937f1c5
 
c107e56
 
 
 
 
 
 
937f1c5
c107e56
 
 
 
 
 
937f1c5
c107e56
 
 
 
937f1c5
 
c107e56
 
 
 
 
 
937f1c5
 
c107e56
 
 
937f1c5
c107e56
426f3e2
c107e56
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
426f3e2
 
 
 
 
 
 
 
 
 
c107e56
 
 
 
 
 
 
 
 
 
426f3e2
 
 
 
 
 
 
 
 
 
c107e56
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
426f3e2
c107e56
 
 
 
 
 
 
a892260
c107e56
 
 
 
426f3e2
c107e56
 
426f3e2
c107e56
 
 
 
426f3e2
 
c107e56
 
 
426f3e2
c107e56
 
 
426f3e2
c107e56
 
 
426f3e2
c107e56
 
426f3e2
c107e56
 
 
426f3e2
c107e56
 
426f3e2
c107e56
426f3e2
c107e56
 
 
426f3e2
c107e56
 
 
 
426f3e2
c107e56
 
 
 
 
 
 
 
 
426f3e2
c107e56
 
 
 
426f3e2
 
c107e56
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c107e56
937f1c5
 
c107e56
 
 
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
426f3e2
937f1c5
 
426f3e2
 
 
c107e56
937f1c5
c107e56
 
 
 
 
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
426f3e2
937f1c5
 
 
c107e56
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
426f3e2
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c107e56
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
c107e56
426f3e2
 
c107e56
937f1c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:11823
- loss:ContrastiveLoss
base_model: AITeamVN/Vietnamese_Embedding_v2
widget:
- source_sentence: 'Biển báo có hình mũi tên chỉ thẳng và rẽ trái đồng thời cho phép
    người tham gia giao thông rẽ phải nếu không có biển báo khác.

    Đúng hay sai?'
  sentences:
  - 'a) Để báo cấm rẽ trái hoặc rẽ phải (theo hướng mũi tên chỉ) ở những vị trí đường
    giao nhau, đặt biển số P.123a "Cấm rẽ trái" hoặc biển số P.123b "Cấm rẽ phải".
    Biển không có giá trị cấm quay đầu xe.

    b) Biển có hiệu lực cấm các loại xe (cơ giới và thô sơ) rẽ sang phía trái hoặc
    phía phải trừ các xe được ưu tiên theo quy định.

    c) Trước khi đặt biển cấm rẽ, có thể đặt biển chỉ dẫn hướng đi thích hợp.


    Hình B.23 - Biển số P.123'
  - 'a) Biển số S.507 được sử dụng độc lập để báo trước cho người tham gia giao thông
    biết chỗ rẽ nguy hiểm và để chỉ hướng rẽ.

    b) Biển được đặt trong trường hợp người tham gia giao thông khó nhận biết hướng
    rẽ của đường. Biển có thể đặt đồng thời hai biển ngược chiều nhau để chỉ hướng
    rẽ trái và rẽ phải, với độ cao đặt biển từ 1,2 m đến 1,5 m. Trường hợp cần dẫn
    hướng trong đường cong có thể sử dụng tiêu phản quang.

    c) Biển không thay thế cho việc đặt các biển báo nguy hiểm số W.201 (a,b) và W.202
    (a,b,c).


    Hình F.9 - Biển số S.507'
  - 'Để báo hiệu đường đi sát vách núi, đặt biển báo nguy hiểm số W223(a,b) “Vách
    núi nguy hiểm". Biển dùng để báo nguy hiểm cho người tham gia giao thông phải
    cẩn thận. Biển đặt ở nơi sắp vào đoạn đường đi sát vách núi vừa hẹp vừa hạn chế
    tầm nhìn. Khi dùng biển cần chú ý vách núi nằm ở bên trái hay bên phải đường để
    đặt biển W.223a hoặc biển W.223b cho phù hợp.


    Hình C.25 - Biển số W.223'
- source_sentence: Biển báo "người tham gia giao thông không được phép đi bộ" yêu
    cầu gì?
  sentences:
  - '29.1. Biển báo nguy hiểm hoặc cảnh báo chủ yếu có hình tam giác đều, ba đỉnh
    lượn tròn; một cạnh nằm ngang, đỉnh tương ứng hướng lên trên, trừ biển số W.208
    “Giao nhau với đường ưu tiên” thì đỉnh tương ứng hướng xuống dưới .

    29.2. Kích thước cụ thể của hình vẽ và màu sắc được quy định chi tiết ở Điều 12,
    Điều 13 và Phụ lục C của Quy chuẩn này.'
  - 'a) Để chỉ dẫn cho người tham gia giao thông biết đường phía trước có làn đường
    dành riêng cho ô tô khách theo chiều ngược lại, đặt biển số I.413a "Đường phía
    trước có làn đường dành cho ô tô khách". Biển được đặt ở nơi đường giao nhau đầu
    đường một chiều mà hướng ngược chiều có ô tô khách được phép chạy.

    b) Để chỉ dẫn cho người tham gia giao thông biết ở nơi đường giao nhau rẽ phải
    hoặc rẽ trái là rẽ ra đường có làn đường dành riêng cho ô tô khách, đặt biển số
    I.413b hoặc biển số I.413c báo hiệu "Rẽ ra đường có làn đường dành cho ô tô khách".
    Tùy theo hướng rẽ mà lựa chọn kiểu biển cho phù hợp.


    Hình E.13 - Biển số I.413'
  - 'Để báo trước sắp đến nơi giao nhau cùng mức của các tuyến đường cùng cấp (không
    có đường nào ưu tiên) trên cùng một mặt bằng, đặt biển số W.205(a,b,c,d,e) "Đường
    giao nhau". Biển được đặt trước nơi đường giao nhau ở ngoài phạm vi nội thành,
    nội thị là chủ yếu. Trong nội thành, nội thị có thể châm chước không đặt biển
    này.


    Hình C.5 - Biển số W.205'
- source_sentence: 'Biển báo này yêu cầu tất cả phương tiện không được phép lưu thông
    vào khu vực có biển báo.

    Đúng hay sai?'
  sentences:
  - '34.1. Các biển hiệu lệnh phải đặt tại vị trí cần báo hiệu lệnh. Do điều kiện
    khó khăn nếu đặt xa hơn phải đặt kèm biển phụ số S.502.

    34.2. Các biển hiệu lệnh có hiệu lực kể từ vị trí đặt biển. Riêng biển số R.301a
    nếu đặt ở sau nơi đường giao nhau tiếp theo thì hiệu lực của biển kể từ vị trí
    đặt biển đến nơi đường giao nhau tiếp theo. Các biển R.301(a,b,c,d,e,f,g,h), R.302(a,b,c),
    R.411, R.412(a,b,c,d,e,f,g,h) và biển R.415 không cấm xe rẽ phải, rẽ trái để ra,
    vào cổng nhà hoặc ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị trên đoạn đường
    có hiệu lực của biển.

    34.3. Nếu đoạn đường phải thi hành biển hiệu lệnh đi qua các nút giao (trừ giao
    với các ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị; hoặc khu đất lân cận
    mà phương tiện chỉ có thể ra, vào khu đất bằng một lối đi chung), biển hiệu lệnh
    phải được nhắc lại đặt phía sau nút giao theo hướng đường đang có biển hiệu lệnh,
    trừ các biển R.420, R.421, các biển hiệu lệnh có tác dụng trong khu vực và các
    trường hợp có qui định riêng.'
  - 'Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông;
    biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc
    tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H;
    thiết bị âm thanh báo hiệu đường bộ.

    Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường
    bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham
    gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận
    trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối
    ngoại.'
  - 'Để báo trước sắp đến đoạn đường có chiều đi và chiều về phân biệt bằng dải phân
    cách cứng, đặt biển số W.235 "Đường đôi". Trong nội thành, nội thị có thể không
    đặt biển này.


    Hình C.37 - Biển số W.235'
- source_sentence: Giả sử một xe ô  con  một xe tải di chuyển cùng lúc trên đoạn
    đường  biển báo có số 80,90 này. Xe ô  con di chuyển với tốc độ 95 km/h
     xe tải di chuyển với tốc độ 85 km/h. Xe nào sẽ bị phạt,   do tại sao?
  sentences:
  - 'Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông;
    biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc
    tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H;
    thiết bị âm thanh báo hiệu đường bộ.

    Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường
    bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham
    gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận
    trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối
    ngoại.'
  - 'Hình A.1 - Các dạng đèn tín hiệu

    a) Dạng đèn 1 Kiểu 1 là dạng đèn thường dùng, có 3 đèn tín hiệu xanh - vàng -
    đỏ. Ngoài ra còn các kiểu 2, 3, 4 các loại đèn báo hiệu cho phép ngoài đèn chính
    còn đèn mũi tên báo hiệu cho phép xe đi thẳng hoặc rẽ trái, rẽ phải, quay đầu.

    b) Dạng đèn 2 bao gồm các kiểu đèn ba màu hình mũi tên nhằm điều khiển các phương
    tiện theo các hướng cụ thể.

    c) Dạng đèn 3: Bên trái là đèn 2 mũi gạch chéo màu đỏ, bên phải là đèn mũi tên
    màu xanh. Khi tín hiệu màu đỏ sáng, các phương tiện phải dừng lại, khi đèn màu
    xanh sáng, các phương tiện được phép đi theo hướng mũi tên.

    d) Dạng đèn 4: Đèn tín hiệu 2 màu, xanh và đỏ. Kiểu 1 là đèn dạng đứng: tín hiệu
    đỏ ở trên, tín hiệu xanh ở dưới; Kiểu 2 là đèn dạng nằm ngang: đèn đỏ bên trái,
    đèn xanh bên phải. Tín hiệu màu đỏ các phương tiện dừng lại, tín hiệu màu xanh
    các phương tiện được đi.

    e) Dạng đèn 5: Đèn tín hiệu một màu đỏ. Kiểu 1 là đèn tròn, kiểu 2 là đèn chữ
    thập.Khi đèn sáng cấm đi, đặt phía sau nút giao theo chiều đi.

    i) Dạng đèn 6 gồm 4 tín hiệu màu trắng có đường kính từ 80 mm đến 100 mm: bảng
    bố trí đèn tín hiệu.

    k) Dạng đèn 7 là đèn tín hiệu điều khiển người đi bộ, người đứng màu đỏ, người
    đi màu xanh. Khi tín hiệu đỏ sáng, người đi bộ không được phép đi, khi tín hiệu
    xanh sáng, người đi bộ được phép đi trong phần đường dành cho người đi bộ. Kiểu
    1: Tín hiệu đỏ bên trái, tín hiệu xanh bên phải; Kiểu 2: tín hiệu đỏ ở trên, tín
    hiệu xanh ở dưới.

    l) Dạng đèn 8 là đèn đếm lùi dùng để hỗ trợ cho các phương tiện giao thông biết
    thời gian có hiệu lực của tín hiệu đèn. Chữ số trên đèn đếm lùi phải hiển thị
    được ở 2 trạng thái màu xanh và màu đỏ. Khi tín hiệu xanh, chữ số màu xanh, khi
    tín hiệu đỏ, chữ số màu đỏ. Kiểu 1 thường sử dụng cho đèn ở vị trí thấp, kiểu
    2 dùng cho đèn ở vị trí cao hoặc ở phía bên kia nút giao.

    m) Dạng đèn 9 là đèn sử dụng để cảnh báo nguy hiểm: đèn nhấp nháy có dạng hình
    tròn hoặc đèn hình chữ có nội dung cảnh báo nguy hiểm. Nội dung của chữ có thể
    thay đổi tùy theo yêu cầu cần cảnh báo. Chu kỳ nháy của đèn phải phù hợp để gây
    chú ý nhưng vẫn phải cho người điều khiển phương tiện đọc được nội dung cần cảnh
    báo.

    n) Ngoài các dạng đèn nêu trên, còn có thể sử dụng đèn mũi tên kết hợp hình một
    loại phương tiện để điều khiển, chỉ dẫn một loại phương tiện cụ thể.

    o) Với các dạng đèn đã nêu, có thể bố trí các tín hiệu khác nhau (xanh, vàng,
    đỏ) trên cùng một bóng đèn nhưng phải đảm bảo một tín hiệu màu duy nhất, rõ ràng
    trên mặt đèn ở từng thời điểm trong chu kỳ của đèn.

    p) Kích thước của đèn từ 200 mm đến 300 mm với các đèn tín hiệu chính. Với các
    đèn có số, chữ và hình phương tiện tham gia giao thông có thể điều chỉnh phù hợp
    để người tham gia giao thông dễ dàng nhận biết.'
  - 'Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông;
    biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc
    tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H;
    thiết bị âm thanh báo hiệu đường bộ.

    Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường
    bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham
    gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận
    trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối
    ngoại.'
- source_sentence: Biển báo với hình mũi tên chỉ hướng đi thẳng  rẽ trái áp dụng
    cho các phương tiện tham gia giao thông trong trường hợp nào?
  sentences:
  - 'Biển số S.505b được đặt, bên dưới biển báo số P.106a “Cấm xe ô tô tải” để chỉ
    các loại xe tải chịu hiệu lực của biển báo và trọng tải toàn bộ xe cho phép (bao
    gồm trọng tải bản thân xe và khối lượng chuyên chở cho phép) tương ứng với mỗi
    loại xe không phụ thuộc vào số lượng trục.

    Biển số S.505b được lắp đặt cho từng cầu. Biển đặt bên phải theo chiều đi cách
    hai đầu cầu từ 10 m đến 20 mở vị trí dễ quan sát.

    Trường hợp cầu hư hỏng đột xuất, cầu có tải trọng khai thác thấp, ngoài việc đặt
    biển số S.505b còn phải đặt bổ sung các bảng thông tin hướng dẫn ở hai đầu đoạn
    tuyến để thông báo cho người tham gia giao thông về vị trí tải trọng của cầu có
    tải trọng khai thác thấp nhất nằm trong đoạn tuyến.


    Hình F.6 - Biển số S.505b'
  - '26.1. Biển báo cấm được đặt ở nơi đường giao nhau hoặc trước một vị trí trên
    đường cần cấm.

    Biển có hiệu lực bắt đầu từ vị trí đặt biển trở đi. Nếu vì lý do nào đó, biển
    đặt cách xa vị trí định cấm thì phải đặt biển phụ số S.502 để chỉ rõ khoảng cách
    từ sau biển cấm đến vị trí biển bắt đầu có hiệu lực.

    26.2. Khi cần thiết để chỉ rõ hướng tác dụng của biển và chỉ vị trí bắt đầu hay
    vị trí kết thúc hiệu lực của biển phải đặt biển phụ số S.503 “Hướng tác dụng của
    biển”.

    26.3. Các biển báo cấm từ biển số P.101 đến biển số P.120 không cần quy định phạm
    vi có hiệu lực của biển, không có biển báo hết cấm.

    26.4. Khi cần thiết, trong trường hợp cấm vì lý do cầu đường bị tắc, hư hỏng thì
    kèm theo các biển báo cấm nêu tại khoản 26.3 Điều này đặt các biển chỉ dẫn lối
    đi cho xe bị cấm.

    26.5. Biển số P.121 và biển số P.128 có hiệu lực đến hết khoảng cách cấm ghi trên
    biển phụ số S.501 hoặc đến vị trí đặt biển số DP.135 “Hết tất cả các lệnh cấm”.

    26.6. Biển số P.123 (a,b) và biển số P.129 có hiệu lực tại khu vực đặt biển.

    26.7. Biển số P.124 (a, b, c, d, e, f) có hiệu lực ở vị trí nơi đường giao nhau,
    chỗ mở dải phân cách nhưng không cho phép quay đầu xe hoặc căn cứ vào biển phụ
    số S.503.

    26.8. Biển số P.125, P.126, P.127(a,b,c), P.130, P.131(a,b,c) có hiệu lực đến
    nơi đường giao nhau tiếp giáp hoặc đến vị trí đặt biển hết cấm (các biển số DP.133,
    DP.134, DP.135, DP.127d). Các biển số P.130 và P.131(a,b,c) còn căn cứ vào các
    biển phụ.

    26.9. Nếu đoạn đường phải thi hành biển cấm đi qua các nút giao (trừ giao với
    các ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị; hoặc khu đất lân cận mà phương
    tiện chỉ có thể ra, vào khu đất bằng một lối đi chung), biển cấm phải được nhắc
    lại đặt phía sau nút giao theo hướng đường đang có biển cấm, trừ các trường hợp
    có qui định riêng hoặc có biển phụ kèm theo.'
  - 'a) Để chỉ dẫn cho người tham gia giao thông biết đường phía trước có làn đường
    dành riêng cho ô tô khách theo chiều ngược lại, đặt biển số I.413a "Đường phía
    trước có làn đường dành cho ô tô khách". Biển được đặt ở nơi đường giao nhau đầu
    đường một chiều mà hướng ngược chiều có ô tô khách được phép chạy.

    b) Để chỉ dẫn cho người tham gia giao thông biết ở nơi đường giao nhau rẽ phải
    hoặc rẽ trái là rẽ ra đường có làn đường dành riêng cho ô tô khách, đặt biển số
    I.413b hoặc biển số I.413c báo hiệu "Rẽ ra đường có làn đường dành cho ô tô khách".
    Tùy theo hướng rẽ mà lựa chọn kiểu biển cho phù hợp.


    Hình E.13 - Biển số I.413'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
---

# SentenceTransformer based on AITeamVN/Vietnamese_Embedding_v2

This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [AITeamVN/Vietnamese_Embedding_v2](https://huggingface.co/AITeamVN/Vietnamese_Embedding_v2) <!-- at revision 18b44161e041bf1d3a333ab5144b5b7b93f914d2 -->
- **Maximum Sequence Length:** 2048 tokens
- **Output Dimensionality:** 1024 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("phonghoccode/VSLP2025_Embedding_semantic_v1")
# Run inference
sentences = [
    'Biển báo với hình mũi tên chỉ hướng đi thẳng và rẽ trái áp dụng cho các phương tiện tham gia giao thông trong trường hợp nào?',
    '26.1. Biển báo cấm được đặt ở nơi đường giao nhau hoặc trước một vị trí trên đường cần cấm.\nBiển có hiệu lực bắt đầu từ vị trí đặt biển trở đi. Nếu vì lý do nào đó, biển đặt cách xa vị trí định cấm thì phải đặt biển phụ số S.502 để chỉ rõ khoảng cách từ sau biển cấm đến vị trí biển bắt đầu có hiệu lực.\n26.2. Khi cần thiết để chỉ rõ hướng tác dụng của biển và chỉ vị trí bắt đầu hay vị trí kết thúc hiệu lực của biển phải đặt biển phụ số S.503 “Hướng tác dụng của biển”.\n26.3. Các biển báo cấm từ biển số P.101 đến biển số P.120 không cần quy định phạm vi có hiệu lực của biển, không có biển báo hết cấm.\n26.4. Khi cần thiết, trong trường hợp cấm vì lý do cầu đường bị tắc, hư hỏng thì kèm theo các biển báo cấm nêu tại khoản 26.3 Điều này đặt các biển chỉ dẫn lối đi cho xe bị cấm.\n26.5. Biển số P.121 và biển số P.128 có hiệu lực đến hết khoảng cách cấm ghi trên biển phụ số S.501 hoặc đến vị trí đặt biển số DP.135 “Hết tất cả các lệnh cấm”.\n26.6. Biển số P.123 (a,b) và biển số P.129 có hiệu lực tại khu vực đặt biển.\n26.7. Biển số P.124 (a, b, c, d, e, f) có hiệu lực ở vị trí nơi đường giao nhau, chỗ mở dải phân cách nhưng không cho phép quay đầu xe hoặc căn cứ vào biển phụ số S.503.\n26.8. Biển số P.125, P.126, P.127(a,b,c), P.130, P.131(a,b,c) có hiệu lực đến nơi đường giao nhau tiếp giáp hoặc đến vị trí đặt biển hết cấm (các biển số DP.133, DP.134, DP.135, DP.127d). Các biển số P.130 và P.131(a,b,c) còn căn cứ vào các biển phụ.\n26.9. Nếu đoạn đường phải thi hành biển cấm đi qua các nút giao (trừ giao với các ngõ, ngách, hẻm hoặc lối ra vào cơ quan, đơn vị; hoặc khu đất lân cận mà phương tiện chỉ có thể ra, vào khu đất bằng một lối đi chung), biển cấm phải được nhắc lại đặt phía sau nút giao theo hướng đường đang có biển cấm, trừ các trường hợp có qui định riêng hoặc có biển phụ kèm theo.',
    'a) Để chỉ dẫn cho người tham gia giao thông biết đường phía trước có làn đường dành riêng cho ô tô khách theo chiều ngược lại, đặt biển số I.413a "Đường phía trước có làn đường dành cho ô tô khách". Biển được đặt ở nơi đường giao nhau đầu đường một chiều mà hướng ngược chiều có ô tô khách được phép chạy.\nb) Để chỉ dẫn cho người tham gia giao thông biết ở nơi đường giao nhau rẽ phải hoặc rẽ trái là rẽ ra đường có làn đường dành riêng cho ô tô khách, đặt biển số I.413b hoặc biển số I.413c báo hiệu "Rẽ ra đường có làn đường dành cho ô tô khách". Tùy theo hướng rẽ mà lựa chọn kiểu biển cho phù hợp.\n\nHình E.13 - Biển số I.413',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```

<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset

* Size: 11,823 training samples
* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>label</code>
* Approximate statistics based on the first 1000 samples:
  |         | sentence1                                                                          | sentence2                                                                             | label                                          |
  |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:-----------------------------------------------|
  | type    | string                                                                             | string                                                                                | int                                            |
  | details | <ul><li>min: 18 tokens</li><li>mean: 32.54 tokens</li><li>max: 70 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 346.37 tokens</li><li>max: 2048 tokens</li></ul> | <ul><li>0: ~94.00%</li><li>1: ~6.00%</li></ul> |
* Samples:
  | sentence1                                                                                    | sentence2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   | label          |
  |:---------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
  | <code>Biển báo cấm xe khách trên 29 chỗ được áp dụng trong các khoảng thời gian nào? </code> | <code>Quy chuẩn này quy định về báo hiệu đường bộ bao gồm: đèn tín hiệu giao thông; biển báo hiệu đường bộ; vạch kẻ đường và các dấu hiệu khác trên mặt đường; cọc tiêu, tường bảo vệ, rào chắn, đinh phản quang, tiêu phản quang, cột Km, cọc H; thiết bị âm thanh báo hiệu đường bộ.<br>Quy chuẩn này quy định về báo hiệu đường bộ áp dụng cho tất cả các tuyến đường bộ trong mạng lưới đường bộ Việt Nam, các đường nằm trong hệ thống đường bộ tham gia Điều ước quốc tế mà Việt Nam là thành viên (Hiệp định GMS-CBTA, các thỏa thuận trong ASEAN và các thỏa thuận quốc tế khác) - sau đây gọi là các tuyến đường đối ngoại.</code> | <code>1</code> |
  | <code>Biển báo cấm xe khách trên 29 chỗ được áp dụng trong các khoảng thời gian nào? </code> | <code>Biển báo nguy hiểm và cảnh báo được dùng để báo cho người tham gia giao thông biết trước tính chất của sự nguy hiểm hoặc các điều cần chú ý phòng ngừa trên tuyến đường. Khi gặp biển báo nguy hiểm và cảnh báo, người tham gia giao thông phải giảm tốc độ đến mức cần thiết, chú ý quan sát và chuẩn bị sẵn sàng xử lý những tình huống có thể xẩy ra để phòng ngừa tai nạn.</code>                                                                                                                                                                                                                                                 | <code>0</code> |
  | <code>Biển báo cấm xe khách trên 29 chỗ được áp dụng trong các khoảng thời gian nào? </code> | <code>a) Đến hết đoạn đường tốc độ tối thiểu, đặt biển số R.307 "Hết hạn chế tốc độ tối thiểu" (hoặc đặt biển số DP.135 "Hết tất cả các lệnh cấm", nếu đồng thời có nhiều biển cấm khác hết tác dụng).<br>b) Biển có giá trị báo cho người tham gia giao thông biết hiệu lực của biển số R.306 hết tác dụng, kể từ biển này các xe được phép chạy chậm hơn trị số ghi trên biển nhưng không được gây cản trở các xe khác.<br><br>Hình D.9 - Biển số R.307</code>                                                                                                                                                                            | <code>0</code> |
* Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
  ```json
  {
      "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
      "margin": 0.5,
      "size_average": true
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `per_device_train_batch_size`: 6
- `per_device_eval_batch_size`: 12
- `gradient_accumulation_steps`: 4
- `learning_rate`: 2e-05
- `num_train_epochs`: 1
- `warmup_ratio`: 0.1
- `fp16`: True
- `push_to_hub`: True
- `hub_model_id`: phonghoccode/VSLP2025_Embedding_semantic_v1
- `gradient_checkpointing`: True

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: no
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 6
- `per_device_eval_batch_size`: 12
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 4
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 2e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 1
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.1
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: True
- `resume_from_checkpoint`: None
- `hub_model_id`: phonghoccode/VSLP2025_Embedding_semantic_v1
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: True
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: proportional

</details>

### Training Logs
| Epoch  | Step | Training Loss |
|:------:|:----:|:-------------:|
| 0.2029 | 100  | 0.0178        |
| 0.4059 | 200  | 0.0003        |
| 0.6088 | 300  | 0.0001        |
| 0.8118 | 400  | 0.0           |


### Framework Versions
- Python: 3.11.13
- Sentence Transformers: 4.1.0
- Transformers: 4.52.4
- PyTorch: 2.6.0+cu124
- Accelerate: 1.8.1
- Datasets: 2.19.2
- Tokenizers: 0.21.2

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### ContrastiveLoss
```bibtex
@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
    title={Dimensionality Reduction by Learning an Invariant Mapping},
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->