quockhangdev commited on
Commit
a2f06ac
·
verified ·
1 Parent(s): e6ae372

Qwen3-Embedding-4B-peft-vilegal-stage1-adapter

Browse files
Files changed (50) hide show
  1. .gitattributes +3 -0
  2. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/.ipynb_checkpoints/adapter_config-checkpoint.json +48 -0
  3. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/1_Pooling/config.json +5 -0
  4. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/README.md +528 -0
  5. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/adapter_config.json +48 -0
  6. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/adapter_model.safetensors +3 -0
  7. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/chat_template.jinja +54 -0
  8. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/1_Pooling/config.json +5 -0
  9. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/README.md +516 -0
  10. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/adapter_config.json +48 -0
  11. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/adapter_model.safetensors +3 -0
  12. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/chat_template.jinja +54 -0
  13. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/config_sentence_transformers.json +14 -0
  14. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/modules.json +20 -0
  15. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/optimizer.pt +3 -0
  16. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_0.pth +3 -0
  17. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_1.pth +3 -0
  18. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_2.pth +3 -0
  19. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_3.pth +3 -0
  20. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/scheduler.pt +3 -0
  21. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/sentence_bert_config.json +10 -0
  22. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/tokenizer.json +3 -0
  23. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/tokenizer_config.json +14 -0
  24. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/trainer_state.json +118 -0
  25. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/training_args.bin +3 -0
  26. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/1_Pooling/config.json +5 -0
  27. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/README.md +528 -0
  28. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/adapter_config.json +48 -0
  29. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/adapter_model.safetensors +3 -0
  30. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/chat_template.jinja +54 -0
  31. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/config_sentence_transformers.json +14 -0
  32. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/modules.json +20 -0
  33. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/optimizer.pt +3 -0
  34. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_0.pth +3 -0
  35. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_1.pth +3 -0
  36. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_2.pth +3 -0
  37. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_3.pth +3 -0
  38. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/scheduler.pt +3 -0
  39. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/sentence_bert_config.json +10 -0
  40. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/tokenizer.json +3 -0
  41. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/tokenizer_config.json +14 -0
  42. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/trainer_state.json +202 -0
  43. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/training_args.bin +3 -0
  44. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/config.json +30 -0
  45. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/config_sentence_transformers.json +14 -0
  46. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/modules.json +20 -0
  47. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/sentence_bert_config.json +10 -0
  48. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/tokenizer.json +3 -0
  49. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/tokenizer_config.json +14 -0
  50. Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/training_args.bin +3 -0
.gitattributes CHANGED
@@ -47,3 +47,6 @@ gemma300-trimmed-large-vi-legal-queries__crosslingual__culturay_250k-freq5___sta
47
  jina-v5-nano-peft-vilegal-stage1/checkpoint-165/tokenizer.json filter=lfs diff=lfs merge=lfs -text
48
  jina-v5-nano-peft-vilegal-stage1/tokenizer.json filter=lfs diff=lfs merge=lfs -text
49
  Qwen3-Embedding-4B-vilegal-stage1-merged/0_Transformer/tokenizer.json filter=lfs diff=lfs merge=lfs -text
 
 
 
 
47
  jina-v5-nano-peft-vilegal-stage1/checkpoint-165/tokenizer.json filter=lfs diff=lfs merge=lfs -text
48
  jina-v5-nano-peft-vilegal-stage1/tokenizer.json filter=lfs diff=lfs merge=lfs -text
49
  Qwen3-Embedding-4B-vilegal-stage1-merged/0_Transformer/tokenizer.json filter=lfs diff=lfs merge=lfs -text
50
+ Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/tokenizer.json filter=lfs diff=lfs merge=lfs -text
51
+ Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/tokenizer.json filter=lfs diff=lfs merge=lfs -text
52
+ Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/tokenizer.json filter=lfs diff=lfs merge=lfs -text
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/.ipynb_checkpoints/adapter_config-checkpoint.json ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alora_invocation_tokens": null,
3
+ "alpha_pattern": {},
4
+ "arrow_config": null,
5
+ "auto_mapping": null,
6
+ "base_model_name_or_path": "Qwen/Qwen3-Embedding-4B",
7
+ "bias": "none",
8
+ "corda_config": null,
9
+ "ensure_weight_tying": false,
10
+ "eva_config": null,
11
+ "exclude_modules": null,
12
+ "fan_in_fan_out": false,
13
+ "inference_mode": false,
14
+ "init_lora_weights": true,
15
+ "layer_replication": null,
16
+ "layers_pattern": null,
17
+ "layers_to_transform": null,
18
+ "loftq_config": {},
19
+ "lora_alpha": 32,
20
+ "lora_bias": false,
21
+ "lora_dropout": 0,
22
+ "lora_ga_config": null,
23
+ "megatron_config": null,
24
+ "megatron_core": "megatron.core",
25
+ "modules_to_save": null,
26
+ "peft_type": "LORA",
27
+ "peft_version": "0.19.1",
28
+ "qalora_group_size": 16,
29
+ "r": 32,
30
+ "rank_pattern": {},
31
+ "revision": null,
32
+ "target_modules": [
33
+ "q_proj",
34
+ "up_proj",
35
+ "o_proj",
36
+ "gate_proj",
37
+ "v_proj",
38
+ "down_proj",
39
+ "k_proj"
40
+ ],
41
+ "target_parameters": null,
42
+ "task_type": "FEATURE_EXTRACTION",
43
+ "trainable_token_indices": null,
44
+ "use_bdlora": null,
45
+ "use_dora": false,
46
+ "use_qalora": false,
47
+ "use_rslora": false
48
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/1_Pooling/config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "embedding_dimension": 2560,
3
+ "pooling_mode": "lasttoken",
4
+ "include_prompt": true
5
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/README.md ADDED
@@ -0,0 +1,528 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:507152
8
+ - loss:CachedMultipleNegativesRankingLoss
9
+ base_model: Qwen/Qwen3-Embedding-4B
10
+ widget:
11
+ - source_sentence: Nếu một người vi phạm các quy định về vệ sinh nơi công cộng, họ
12
+ sẽ bị xử lý như thế nào?
13
+ sentences:
14
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
15
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
16
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
17
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
18
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
19
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
20
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
21
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
22
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
23
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
24
+ mở thưởng trên thực tế.'
25
+ - Chương 10. KHEN THƯỞNG VÀ XỬ LÝ CÁC VI PHẠM Điều 52. Khen thưởng.. Địa phương,
26
+ đơn vị, cá nhân có thành tích trong công tác bảo vệ sức khoẻ nhân dân được Nhà
27
+ nước khen thưởng vật chất và tinh thần. Thầy thuốc, lương y, dược sĩ và nhân viên
28
+ y tế khác có nhiều cống hiến trong sự nghiệp bảo vệ sức khoẻ nhân dân, có trình
29
+ độ nghiệp vụ, chuyên môn kỹ thuật giỏi, có đạo đức, được nhân dân và đồng nghiệp
30
+ tín nhiệm thì được xét tặng danh hiệu cao quý của Nhà nước. Điều 53. Xử lý các
31
+ vi phạm. Người nào có những hành vi sau đây thì tuỳ theo mức độ nhẹ hoặc nặng
32
+ sẽ bị xứ lý kỷ luật, bị xử lý hành chính hoặc bị truy cứu trách nhiệm hình sự.
33
+ 1- Vi phạm các quy định về giữ gìn vệ sinh nơi công cộng, phòng và chống dịch,
34
+ bệnh. 2- Vi phạm các quy định về khám bệnh, chữa bệnh, sản xuất thuốc và bán thuốc.
35
+ 3- Vi phạm các quy định về vệ sinh lương thực, thực phẩm, vệ sinh lao động và
36
+ các quy định khác của Luật bảo vệ sức khoẻ nhân dân.
37
+ - Điều 4. Mẫu các văn bản ban hành kèm theo Thông tư liên tịch 1. Đơn xin hoãn,
38
+ miễn chấp hành án phạt tù (Mẫu số 01). 2. Quyết định hoãn chấp hành án phạt tù
39
+ (Mẫu số 02). 3. Quyết định hủy Quyết định hoãn chấp hành án phạt tù (Mẫu số 03).
40
+ 4. Quyết định hủy Quyết định hoãn chấp hành án phạt tù và áp dụng biện pháp bắt
41
+ buộc chữa bệnh (Mẫu số 04). 5. Quyết định mở phiên họp xem xét miễn chấp hành
42
+ án phạt tù (Mẫu số 05). 6. Quyết định về việc xét miễn chấp hành án phạt tù (Mẫu
43
+ số 06).
44
+ - source_sentence: Trước khi tiến hành nhận dạng, thực nghiệm điều tra, nhận biết
45
+ giọng nói, Điều tra viên phải thông báo cho Kiểm sát viên biết trước bao nhiêu
46
+ giờ?
47
+ sentences:
48
+ - Khoản 1. Việc nhận dạng, thực nghiệm điều tra, nhận biết giọng nói được thực hiện
49
+ theo quy định tại các điều 190, 191, 204 và 421 của Bộ luật Tố tụng hình sự. Chậm
50
+ nhất 24 giờ trước khi tiến hành, Điều tra viên báo cho Kiểm sát viên biết thời
51
+ gian, địa điểm nhận dạng, thực nghiệm điều tra, nhận biết giọng nói. Kiểm sát
52
+ viên phải có mặt để kiểm sát. Điều tra viên và Kiểm sát viên phối hợp kiểm tra,
53
+ đánh giá kết quả nhận dạng, thực nghiệm điều tra, nhận biết giọng nói để đề ra
54
+ các yêu cầu điều tra tiếp theo. Trường hợp vì lý do khách quan không có mặt để
55
+ kiểm sát trực tiếp thì Kiểm sát viên báo cho Điều tra viên trước khi tiến hành
56
+ 02 giờ.
57
+ - 'Khoản 2. Giám định viên, tổ chức được trưng cầu giám định có trách nhiệm như
58
+ sau: a) Giám định và ban hành kết luận giám định trong thời hạn 05 ngày kể từ
59
+ ngày nhận được quyết định trưng cầu giám định. Trường hợp không thể tiến hành
60
+ trong thời hạn thì kịp thời thông báo bằng văn bản để cơ quan trưng cầu giám định
61
+ biết, nêu rõ lý do, thời gian dự kiến ban hành kết luận giám định; b) Gửi kết
62
+ luận giám định cho cơ quan đã trưng cầu giám định trong thời hạn quy định tại
63
+ khoản 2 Điều 213 của Bộ luật Tố tụng hình sự; c) Kịp thời có mặt để thực hiện
64
+ kiểm tra dấu vết, thu mẫu giám định trong trường hợp quy định tại điểm a khoản
65
+ 1 Điều này; trường hợp không thể có mặt thì phải thông báo ngay và nêu rõ lý do
66
+ cho Điều tra viên biết; d) Khi tiến hành giám định, nếu thấy nội dung yêu cầu
67
+ giám định chưa rõ ràng thì yêu cầu cơ quan trưng cầu giám định giải thích và bổ
68
+ sung tài liệu. Khi cơ quan trưng cầu đề nghị, Giám định viên kịp thời giải thích
69
+ cụ thể các vấn đề trong kết luận giám định.'
70
+ - 'Điều 19. Hệ thống quay số mở thưởng điện tử 1. Hệ thống quay số mở thưởng điện
71
+ tử bao gồm: a) Thiết bị quay số mở thưởng tự động, bao gồm: Hệ thống phần cứng
72
+ và phần mềm quay số tự động; b) Hệ thống camera, màn hình phục vụ cho việc giám
73
+ sát được thiết bị quay số mở thưởng tự động. 2. Yêu cầu đối với thiết bị quay
74
+ số mở thưởng tự động: a) Có xuất xứ rõ ràng, đảm bảo các tiêu chuẩn và thông số
75
+ kỹ thuật theo đúng thiết kế của nhà sản xuất và được kiểm định bởi công ty kiểm
76
+ định độc lập; b) Vận hành an toàn, ổn định và đảm bảo hoàn toàn ngẫu nhiên, không
77
+ có bất kỳ sự can thiệp nào từ bên ngoài vào kết quả mở thưởng; c) Có ít nhất một
78
+ (01) thiết bị dự phòng; d) Được lắp đặt và vận hành tại khu vực riêng biệt và
79
+ được niêm phong trong suốt quá trình hoạt động để đảm bảo tất cả các đối tượng
80
+ không có nhiệm vụ không được can thiệp vào phần cứng, phần mềm của thiết bị quay
81
+ số mở thưởng tự động;'
82
+ - source_sentence: Bộ Tài chính quy định thế nào về thành phần và cấu trúc của Hội
83
+ đồng giám sát xổ số trong công ty xổ số điện toán?
84
+ sentences:
85
+ - 'Khoản 2. Thành phần Hội đồng giám sát xổ số bao gồm Chủ tịch, một số Phó chủ
86
+ tịch và các thành viên Hội đồng giám sát xổ số như sau: a) Chủ tịch Hội đồng giám
87
+ sát xổ số: là Chủ tịch hoặc Tổng giám đốc của công ty xổ số điện toán; b) Phó
88
+ chủ tịch Hội đồng giám sát xổ số: là Phó tổng giám đốc hoặc Kế toán trưởng của
89
+ công ty xổ số điện toán; c) Các thành viên Hội đồng giám sát xổ số: là lãnh đạo
90
+ một số phòng, ban nghiệp vụ của công ty xổ số điện toán; d) Công ty xổ số điện
91
+ toán có thể mời đại diện một số tổ chức chính trị - xã hội tham gia Hội đồng giám
92
+ sát xổ số với vai trò là thành viên Hội đồng giám sát xổ số.'
93
+ - 'Điều 9. Công nhận điều chỉnh hạng, công nhận lại hạng nhà chung cư 1. Việc công
94
+ nhận điều chỉnh hạng hoặc công nhận lại hạng nhà chung cư được thực hiện theo
95
+ đề nghị của tổ chức, cá nhân quy định tại Điều 4 của Thông tư này. 2. Trường hợp
96
+ quyết định công nhận hạng nhà chung cư chưa hết thời hạn theo quy định mà tổ chức,
97
+ cá nhân quy định tại Điều 4 của Thông tư có nhu cầu điều chỉnh hạng nhà chung
98
+ cư thì phải nộp 01 bộ hồ sơ quy định tại Khoản 3 Điều này tại Sở Xây dựng để được
99
+ xem xét, kiểm tra và công nhận điều chỉnh hạng nhà chung cư. Trình tự, thủ tục
100
+ công nhận điều chỉnh hạng nhà chung cư được thực hiện theo quy định tại Khoản
101
+ 2 Điều 8 của Thông tư này. Khi giao quyết định công nhận hạng nhà chung cư (đã
102
+ điều chỉnh), Sở Xây dựng phải thu hồi bản gốc quyết định công nhận hạng đang còn
103
+ thời hạn để lưu hồ sơ và đăng tải thông tin, văn bản quyết định trên Cổng thông
104
+ tin điện tử của Sở Xây dựng. 3. Hồ sơ đề nghị điều chỉnh hạng nhà chung cư bao
105
+ gồm: a) Đơn đề nghị điều chỉnh hạng nhà chung cư theo mẫu hướng dẫn tham khảo
106
+ quy định tại phụ lục số 03 ban hành kèm theo Thông tư này;'
107
+ - Điều 7. Hồ sơ đề nghị công nhận hạng nhà chung cư 1. Đơn đề nghị công nhận hạng
108
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 03 ban hành
109
+ kèm theo Thông tư này. 2. Bản sao có chứng thực Giấy phép xây dựng nhà chung cư
110
+ (đối với nhà chung cư thuộc diện phải có Giấy phép xây dựng theo quy định của
111
+ pháp luật về xây dựng). 3. Bản sao có chứng thực quyết định phê duyệt quy hoạch
112
+ chi tiết tỷ lệ 1/500 hoặc văn bản chấp thuận tổng mặt bằng khu vực có nhà chung
113
+ cư (đối với trường hợp không phải lập quy hoạch chi tiết tỷ lệ 1/500) kèm theo
114
+ bản vẽ tổng mặt bằng nhà chung cư đã được cơ quan có thẩm quyền phê duyệt. 4.
115
+ Bản sao có chứng thực văn bản thẩm định của cơ quan có thẩm quyền kèm theo bản
116
+ vẽ thiết kế cơ sở nhà chung cư theo quy định của pháp luật về xây dựng. 5. Bản
117
+ sao có chứng thực văn bản thông báo kết quả kiểm tra công tác nghiệm thu hoàn
118
+ thành công trình nhà chung cư của cơ quan chuyên môn về xây dựng. 6. Bản tự kê
119
+ khai, đánh giá phân hạng nhà chung cư của tổ chức, cá nhân đề nghị công nhận hạng
120
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 04 ban hành
121
+ kèm theo Thông tư này.
122
+ - source_sentence: Nếu đại lý xổ số tự chọn số điện toán không vận hành thiết bị bán
123
+ vé đúng hướng dẫn, họ sẽ phải chịu trách nhiệm gì?
124
+ sentences:
125
+ - 'Khoản 1. Tổ chức vận hành hệ thống xổ số tự chọn số điện toán: a) Công ty xổ
126
+ số điện toán chịu trách nhiệm tổ chức quản lý và vận hành hệ thống xổ số tự chọn
127
+ số điện toán theo quy định của pháp luật. Các đại lý xổ số tự chọn số điện toán
128
+ vận hành các thiết bị bán vé xổ số tự chọn số điện toán theo hướng dẫn của công
129
+ ty xổ số điện toán và chịu trách nhiệm về các thiết bị được giao quản lý theo
130
+ hợp đồng ký kết giữa các bên. Các doanh nghiệp cung cấp dịch vụ mạng xã hội trực
131
+ tuyến, doanh nghiệp viễn thông tham gia vào hoạt động kinh doanh xổ số tự chọn
132
+ số điện toán chịu trách nhiệm đảm bảo an ninh mạng, an toàn thông tin theo quy
133
+ định của pháp luật; b) Hệ thống xổ số tự chọn số điện toán (máy chủ, thiết bị
134
+ đầu cuối và các thiết bị đồng bộ khác) phải được kiểm tra, bảo dưỡng, bảo trì
135
+ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán để đảm
136
+ bảo yêu cầu vận hành an toàn, chính xác;'
137
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
138
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
139
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
140
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
141
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
142
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
143
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
144
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
145
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
146
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
147
+ mở thưởng trên thực tế.'
148
+ - 'Khoản 3. Cấp công trình của một tổ hợp các công trình hoặc một dây chuyền công
149
+ nghệ gồm nhiều hạng mục được xác định như sau: a) Trường hợp tổ hợp các công trình
150
+ hoặc dây chuyền công nghệ gồm nhiều hạng mục có quy định trong Phụ lục I Thông
151
+ tư này thì cấp công trình được xác định theo Phụ lục I Thông tư này; b) Trường
152
+ hợp tổ hợp các công trình hoặc dây chuyền công nghệ gồm nhiều hạng mục không quy
153
+ định trong Phụ lục I Thông tư này thì cấp công trình được xác định theo cấp của
154
+ công trình chính (thuộc tổ hợp các công trình hoặc dây chuyền công nghệ) có cấp
155
+ cao nhất. Cấp của công trình chính xác định theo quy định tại khoản 2 Điều này.'
156
+ - source_sentence: Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo
157
+ dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?
158
+ sentences:
159
+ - Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục
160
+ Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì,
161
+ phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành
162
+ có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận
163
+ hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực
164
+ thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ
165
+ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân
166
+ hạng và công nhận hạng nhà chung cư trên địa bàn.
167
+ - đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của
168
+ nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng
169
+ một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở
170
+ thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng.
171
+ Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi
172
+ (60) ngày, kể từ ngày quay số mở thưởng.
173
+ - 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu
174
+ chí sau: a) Mức độ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc
175
+ lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng
176
+ mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại
177
+ Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập
178
+ thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ
179
+ lục II Thông tư này.'
180
+ pipeline_tag: sentence-similarity
181
+ library_name: sentence-transformers
182
+ ---
183
+
184
+ # SentenceTransformer based on Qwen/Qwen3-Embedding-4B
185
+
186
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B). It maps sentences & paragraphs to a 2560-dimensional dense vector space and can be used for retrieval.
187
+
188
+ ## Model Details
189
+
190
+ ### Model Description
191
+ - **Model Type:** Sentence Transformer
192
+ - **Base model:** [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B) <!-- at revision 5cf2132abc99cad020ac570b19d031efec650f2b -->
193
+ - **Maximum Sequence Length:** 40960 tokens
194
+ - **Output Dimensionality:** 2560 dimensions
195
+ - **Similarity Function:** Cosine Similarity
196
+ - **Supported Modality:** Text
197
+ <!-- - **Training Dataset:** Unknown -->
198
+ <!-- - **Language:** Unknown -->
199
+ <!-- - **License:** Unknown -->
200
+
201
+ ### Model Sources
202
+
203
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
204
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
205
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
206
+
207
+ ### Full Model Architecture
208
+
209
+ ```
210
+ SentenceTransformer(
211
+ (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'Qwen3Model'})
212
+ (1): Pooling({'embedding_dimension': 2560, 'pooling_mode': 'lasttoken', 'include_prompt': True})
213
+ (2): Normalize({})
214
+ )
215
+ ```
216
+
217
+ ## Usage
218
+
219
+ ### Direct Usage (Sentence Transformers)
220
+
221
+ First install the Sentence Transformers library:
222
+
223
+ ```bash
224
+ pip install -U sentence-transformers
225
+ ```
226
+ Then you can load this model and run inference.
227
+ ```python
228
+ from sentence_transformers import SentenceTransformer
229
+
230
+ # Download from the 🤗 Hub
231
+ model = SentenceTransformer("sentence_transformers_model_id")
232
+ # Run inference
233
+ queries = [
234
+ 'Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?',
235
+ ]
236
+ documents = [
237
+ 'đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng. Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi (60) ngày, kể từ ngày quay số mở thưởng.',
238
+ 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu chí sau: a) Mức ��ộ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ lục II Thông tư này.',
239
+ 'Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên địa bàn.',
240
+ ]
241
+ query_embeddings = model.encode_query(queries)
242
+ document_embeddings = model.encode_document(documents)
243
+ print(query_embeddings.shape, document_embeddings.shape)
244
+ # [1, 2560] [3, 2560]
245
+
246
+ # Get the similarity scores for the embeddings
247
+ similarities = model.similarity(query_embeddings, document_embeddings)
248
+ print(similarities)
249
+ # tensor([[ 0.6850, -0.0339, 0.1120]])
250
+ ```
251
+ <!--
252
+ ### Direct Usage (Transformers)
253
+
254
+ <details><summary>Click to see the direct usage in Transformers</summary>
255
+
256
+ </details>
257
+ -->
258
+
259
+ <!--
260
+ ### Downstream Usage (Sentence Transformers)
261
+
262
+ You can finetune this model on your own dataset.
263
+
264
+ <details><summary>Click to expand</summary>
265
+
266
+ </details>
267
+ -->
268
+
269
+ <!--
270
+ ### Out-of-Scope Use
271
+
272
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
273
+ -->
274
+
275
+ <!--
276
+ ## Bias, Risks and Limitations
277
+
278
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
279
+ -->
280
+
281
+ <!--
282
+ ### Recommendations
283
+
284
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
285
+ -->
286
+
287
+ ## Training Details
288
+
289
+ ### Training Dataset
290
+
291
+ #### Unnamed Dataset
292
+
293
+ * Size: 507,152 training samples
294
+ * Columns: <code>anchor</code> and <code>positive</code>
295
+ * Approximate statistics based on the first 1000 samples:
296
+ | | anchor | positive |
297
+ |:--------|:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------|
298
+ | type | string | string |
299
+ | details | <ul><li>min: 43 characters</li><li>mean: 117.84 characters</li><li>max: 318 characters</li></ul> | <ul><li>min: 444 characters</li><li>mean: 790.51 characters</li><li>max: 1195 characters</li></ul> |
300
+ * Samples:
301
+ | anchor | positive |
302
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
303
+ | <code>Bộ Giao thông vận tải quy định các đơn vị kinh doanh vận tải nào phải lắp đặt thiết bị giám sát hành trình trên xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
304
+ | <code>Bộ Giao thông vận tải giải thích như thế nào về các từ ngữ như 'hệ thống thông tin' và 'dữ liệu' trong quy định về thiết bị giám sát hành trình?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
305
+ | <code>Pháp luật quy định như thế nào về việc thu nhận, quản lý và khai thác dữ liệu từ thiết bị giám sát hành trình của xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát h��nh trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
306
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
307
+ ```json
308
+ {
309
+ "scale": 20.0,
310
+ "similarity_fct": "cos_sim",
311
+ "mini_batch_size": 16,
312
+ "gather_across_devices": false,
313
+ "directions": [
314
+ "query_to_doc"
315
+ ],
316
+ "partition_mode": "joint",
317
+ "hardness_mode": null,
318
+ "hardness_strength": 0.0
319
+ }
320
+ ```
321
+
322
+ ### Training Hyperparameters
323
+ #### Non-Default Hyperparameters
324
+
325
+ - `per_device_train_batch_size`: 1024
326
+ - `num_train_epochs`: 2
327
+ - `learning_rate`: 2e-05
328
+ - `lr_scheduler_type`: constant_with_warmup
329
+ - `warmup_steps`: 0.1
330
+ - `bf16`: True
331
+ - `dataloader_num_workers`: 8
332
+ - `dataloader_persistent_workers`: True
333
+ - `remove_unused_columns`: False
334
+ - `ddp_find_unused_parameters`: False
335
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
336
+ Query:
337
+ - `batch_sampler`: no_duplicates
338
+
339
+ #### All Hyperparameters
340
+ <details><summary>Click to expand</summary>
341
+
342
+ - `per_device_train_batch_size`: 1024
343
+ - `num_train_epochs`: 2
344
+ - `max_steps`: -1
345
+ - `learning_rate`: 2e-05
346
+ - `lr_scheduler_type`: constant_with_warmup
347
+ - `lr_scheduler_kwargs`: None
348
+ - `warmup_steps`: 0.1
349
+ - `optim`: adamw_torch_fused
350
+ - `optim_args`: None
351
+ - `weight_decay`: 0.0
352
+ - `adam_beta1`: 0.9
353
+ - `adam_beta2`: 0.999
354
+ - `adam_epsilon`: 1e-08
355
+ - `optim_target_modules`: None
356
+ - `gradient_accumulation_steps`: 1
357
+ - `average_tokens_across_devices`: True
358
+ - `max_grad_norm`: 1.0
359
+ - `label_smoothing_factor`: 0.0
360
+ - `bf16`: True
361
+ - `fp16`: False
362
+ - `bf16_full_eval`: False
363
+ - `fp16_full_eval`: False
364
+ - `tf32`: None
365
+ - `gradient_checkpointing`: False
366
+ - `gradient_checkpointing_kwargs`: None
367
+ - `torch_compile`: False
368
+ - `torch_compile_backend`: None
369
+ - `torch_compile_mode`: None
370
+ - `use_liger_kernel`: False
371
+ - `liger_kernel_config`: None
372
+ - `use_cache`: False
373
+ - `neftune_noise_alpha`: None
374
+ - `torch_empty_cache_steps`: None
375
+ - `auto_find_batch_size`: False
376
+ - `log_on_each_node`: True
377
+ - `logging_nan_inf_filter`: True
378
+ - `include_num_input_tokens_seen`: no
379
+ - `log_level`: passive
380
+ - `log_level_replica`: warning
381
+ - `disable_tqdm`: False
382
+ - `project`: huggingface
383
+ - `trackio_space_id`: trackio
384
+ - `per_device_eval_batch_size`: 8
385
+ - `prediction_loss_only`: True
386
+ - `eval_on_start`: False
387
+ - `eval_do_concat_batches`: True
388
+ - `eval_use_gather_object`: False
389
+ - `eval_accumulation_steps`: None
390
+ - `include_for_metrics`: []
391
+ - `batch_eval_metrics`: False
392
+ - `save_only_model`: False
393
+ - `save_on_each_node`: False
394
+ - `enable_jit_checkpoint`: False
395
+ - `push_to_hub`: False
396
+ - `hub_private_repo`: None
397
+ - `hub_model_id`: None
398
+ - `hub_strategy`: every_save
399
+ - `hub_always_push`: False
400
+ - `hub_revision`: None
401
+ - `load_best_model_at_end`: False
402
+ - `ignore_data_skip`: False
403
+ - `restore_callback_states_from_checkpoint`: False
404
+ - `full_determinism`: False
405
+ - `seed`: 42
406
+ - `data_seed`: None
407
+ - `use_cpu`: False
408
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
409
+ - `parallelism_config`: None
410
+ - `dataloader_drop_last`: True
411
+ - `dataloader_num_workers`: 8
412
+ - `dataloader_pin_memory`: True
413
+ - `dataloader_persistent_workers`: True
414
+ - `dataloader_prefetch_factor`: None
415
+ - `remove_unused_columns`: False
416
+ - `label_names`: None
417
+ - `train_sampling_strategy`: random
418
+ - `length_column_name`: length
419
+ - `ddp_find_unused_parameters`: False
420
+ - `ddp_bucket_cap_mb`: None
421
+ - `ddp_broadcast_buffers`: False
422
+ - `ddp_backend`: None
423
+ - `ddp_timeout`: 1800
424
+ - `fsdp`: []
425
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
426
+ - `deepspeed`: None
427
+ - `debug`: []
428
+ - `skip_memory_metrics`: True
429
+ - `do_predict`: False
430
+ - `resume_from_checkpoint`: None
431
+ - `warmup_ratio`: None
432
+ - `local_rank`: -1
433
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
434
+ Query:
435
+ - `batch_sampler`: no_duplicates
436
+ - `multi_dataset_batch_sampler`: proportional
437
+ - `router_mapping`: {}
438
+ - `learning_rate_mapping`: {}
439
+
440
+ </details>
441
+
442
+ ### Training Logs
443
+ | Epoch | Step | Training Loss |
444
+ |:------:|:----:|:-------------:|
445
+ | 0.0813 | 10 | 0.3239 |
446
+ | 0.1626 | 20 | 0.3034 |
447
+ | 0.2439 | 30 | 0.2333 |
448
+ | 0.3252 | 40 | 0.1800 |
449
+ | 0.4065 | 50 | 0.1686 |
450
+ | 0.4878 | 60 | 0.1541 |
451
+ | 0.5691 | 70 | 0.1425 |
452
+ | 0.6504 | 80 | 0.1341 |
453
+ | 0.7317 | 90 | 0.1300 |
454
+ | 0.8130 | 100 | 0.1205 |
455
+ | 0.8943 | 110 | 0.1214 |
456
+ | 0.9756 | 120 | 0.1174 |
457
+ | 1.0569 | 130 | 0.1123 |
458
+ | 1.1382 | 140 | 0.1107 |
459
+ | 1.2195 | 150 | 0.1116 |
460
+ | 1.3008 | 160 | 0.1054 |
461
+ | 1.3821 | 170 | 0.1066 |
462
+ | 1.4634 | 180 | 0.1062 |
463
+ | 1.5447 | 190 | 0.1031 |
464
+ | 1.6260 | 200 | 0.1027 |
465
+ | 1.7073 | 210 | 0.1005 |
466
+ | 1.7886 | 220 | 0.0995 |
467
+ | 1.8699 | 230 | 0.1000 |
468
+ | 1.9512 | 240 | 0.0957 |
469
+
470
+
471
+ ### Training Time
472
+ - **Training**: 2.6 hours
473
+
474
+ ### Framework Versions
475
+ - Python: 3.10.20
476
+ - Sentence Transformers: 5.4.1
477
+ - Transformers: 5.5.4
478
+ - PyTorch: 2.9.1+cu130
479
+ - Accelerate: 1.13.0
480
+ - Datasets: 4.8.4
481
+ - Tokenizers: 0.22.2
482
+
483
+ ## Citation
484
+
485
+ ### BibTeX
486
+
487
+ #### Sentence Transformers
488
+ ```bibtex
489
+ @inproceedings{reimers-2019-sentence-bert,
490
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
491
+ author = "Reimers, Nils and Gurevych, Iryna",
492
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
493
+ month = "11",
494
+ year = "2019",
495
+ publisher = "Association for Computational Linguistics",
496
+ url = "https://arxiv.org/abs/1908.10084",
497
+ }
498
+ ```
499
+
500
+ #### CachedMultipleNegativesRankingLoss
501
+ ```bibtex
502
+ @misc{gao2021scaling,
503
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
504
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
505
+ year={2021},
506
+ eprint={2101.06983},
507
+ archivePrefix={arXiv},
508
+ primaryClass={cs.LG}
509
+ }
510
+ ```
511
+
512
+ <!--
513
+ ## Glossary
514
+
515
+ *Clearly define terms in order to be accessible across audiences.*
516
+ -->
517
+
518
+ <!--
519
+ ## Model Card Authors
520
+
521
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
522
+ -->
523
+
524
+ <!--
525
+ ## Model Card Contact
526
+
527
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
528
+ -->
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/adapter_config.json ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alora_invocation_tokens": null,
3
+ "alpha_pattern": {},
4
+ "arrow_config": null,
5
+ "auto_mapping": null,
6
+ "base_model_name_or_path": "Qwen/Qwen3-Embedding-4B",
7
+ "bias": "none",
8
+ "corda_config": null,
9
+ "ensure_weight_tying": false,
10
+ "eva_config": null,
11
+ "exclude_modules": null,
12
+ "fan_in_fan_out": false,
13
+ "inference_mode": false,
14
+ "init_lora_weights": true,
15
+ "layer_replication": null,
16
+ "layers_pattern": null,
17
+ "layers_to_transform": null,
18
+ "loftq_config": {},
19
+ "lora_alpha": 32,
20
+ "lora_bias": false,
21
+ "lora_dropout": 0,
22
+ "lora_ga_config": null,
23
+ "megatron_config": null,
24
+ "megatron_core": "megatron.core",
25
+ "modules_to_save": null,
26
+ "peft_type": "LORA",
27
+ "peft_version": "0.19.1",
28
+ "qalora_group_size": 16,
29
+ "r": 32,
30
+ "rank_pattern": {},
31
+ "revision": null,
32
+ "target_modules": [
33
+ "q_proj",
34
+ "up_proj",
35
+ "o_proj",
36
+ "gate_proj",
37
+ "v_proj",
38
+ "down_proj",
39
+ "k_proj"
40
+ ],
41
+ "target_parameters": null,
42
+ "task_type": "FEATURE_EXTRACTION",
43
+ "trainable_token_indices": null,
44
+ "use_bdlora": null,
45
+ "use_dora": false,
46
+ "use_qalora": false,
47
+ "use_rslora": false
48
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/adapter_model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:13733c58c57f04db6ed5691fb01f55fdda32c048d8a01634494305df347106ba
3
+ size 132185368
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/chat_template.jinja ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {%- if tools %}
2
+ {{- '<|im_start|>system\n' }}
3
+ {%- if messages[0]['role'] == 'system' %}
4
+ {{- messages[0]['content'] }}
5
+ {%- else %}
6
+ {{- 'You are a helpful assistant.' }}
7
+ {%- endif %}
8
+ {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
9
+ {%- for tool in tools %}
10
+ {{- "\n" }}
11
+ {{- tool | tojson }}
12
+ {%- endfor %}
13
+ {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
14
+ {%- else %}
15
+ {%- if messages[0]['role'] == 'system' %}
16
+ {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
17
+ {%- else %}
18
+ {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
19
+ {%- endif %}
20
+ {%- endif %}
21
+ {%- for message in messages %}
22
+ {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
23
+ {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
24
+ {%- elif message.role == "assistant" %}
25
+ {{- '<|im_start|>' + message.role }}
26
+ {%- if message.content %}
27
+ {{- '\n' + message.content }}
28
+ {%- endif %}
29
+ {%- for tool_call in message.tool_calls %}
30
+ {%- if tool_call.function is defined %}
31
+ {%- set tool_call = tool_call.function %}
32
+ {%- endif %}
33
+ {{- '\n<tool_call>\n{"name": "' }}
34
+ {{- tool_call.name }}
35
+ {{- '", "arguments": ' }}
36
+ {{- tool_call.arguments | tojson }}
37
+ {{- '}\n</tool_call>' }}
38
+ {%- endfor %}
39
+ {{- '<|im_end|>\n' }}
40
+ {%- elif message.role == "tool" %}
41
+ {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
42
+ {{- '<|im_start|>user' }}
43
+ {%- endif %}
44
+ {{- '\n<tool_response>\n' }}
45
+ {{- message.content }}
46
+ {{- '\n</tool_response>' }}
47
+ {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
48
+ {{- '<|im_end|>\n' }}
49
+ {%- endif %}
50
+ {%- endif %}
51
+ {%- endfor %}
52
+ {%- if add_generation_prompt %}
53
+ {{- '<|im_start|>assistant\n' }}
54
+ {%- endif %}
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/1_Pooling/config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "embedding_dimension": 2560,
3
+ "pooling_mode": "lasttoken",
4
+ "include_prompt": true
5
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/README.md ADDED
@@ -0,0 +1,516 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:507152
8
+ - loss:CachedMultipleNegativesRankingLoss
9
+ base_model: Qwen/Qwen3-Embedding-4B
10
+ widget:
11
+ - source_sentence: Nếu một người vi phạm các quy định về vệ sinh nơi công cộng, họ
12
+ sẽ bị xử lý như thế nào?
13
+ sentences:
14
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
15
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
16
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
17
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
18
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
19
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
20
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
21
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
22
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
23
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
24
+ mở thưởng trên thực tế.'
25
+ - Chương 10. KHEN THƯỞNG VÀ XỬ LÝ CÁC VI PHẠM Điều 52. Khen thưởng.. Địa phương,
26
+ đơn vị, cá nhân có thành tích trong công tác bảo vệ sức khoẻ nhân dân được Nhà
27
+ nước khen thưởng vật chất và tinh thần. Thầy thuốc, lương y, dược sĩ và nhân viên
28
+ y tế khác có nhiều cống hiến trong sự nghiệp bảo vệ sức khoẻ nhân dân, có trình
29
+ độ nghiệp vụ, chuyên môn kỹ thuật giỏi, có đạo đức, được nhân dân và đồng nghiệp
30
+ tín nhiệm thì được xét tặng danh hiệu cao quý của Nhà nước. Điều 53. Xử lý các
31
+ vi phạm. Người nào có những hành vi sau đây thì tuỳ theo mức độ nhẹ hoặc nặng
32
+ sẽ bị xứ lý kỷ luật, bị xử lý hành chính hoặc bị truy cứu trách nhiệm hình sự.
33
+ 1- Vi phạm các quy định về giữ gìn vệ sinh nơi công cộng, phòng và chống dịch,
34
+ bệnh. 2- Vi phạm các quy định về khám bệnh, chữa bệnh, sản xuất thuốc và bán thuốc.
35
+ 3- Vi phạm các quy định về vệ sinh lương thực, thực phẩm, vệ sinh lao động và
36
+ các quy định khác của Luật bảo vệ sức khoẻ nhân dân.
37
+ - Điều 4. Mẫu các văn bản ban hành kèm theo Thông tư liên tịch 1. Đơn xin hoãn,
38
+ miễn chấp hành án phạt tù (Mẫu số 01). 2. Quyết định hoãn chấp hành án phạt tù
39
+ (Mẫu số 02). 3. Quyết định hủy Quyết định hoãn chấp hành án phạt tù (Mẫu số 03).
40
+ 4. Quyết định hủy Quyết định hoãn chấp hành án phạt tù và áp dụng biện pháp bắt
41
+ buộc chữa bệnh (Mẫu số 04). 5. Quyết định mở phiên họp xem xét miễn chấp hành
42
+ án phạt tù (Mẫu số 05). 6. Quyết định về việc xét miễn chấp hành án phạt tù (Mẫu
43
+ số 06).
44
+ - source_sentence: Trước khi tiến hành nhận dạng, thực nghiệm điều tra, nhận biết
45
+ giọng nói, Điều tra viên phải thông báo cho Kiểm sát viên biết trước bao nhiêu
46
+ giờ?
47
+ sentences:
48
+ - Khoản 1. Việc nhận dạng, thực nghiệm điều tra, nhận biết giọng nói được thực hiện
49
+ theo quy định tại các điều 190, 191, 204 và 421 của Bộ luật Tố tụng hình sự. Chậm
50
+ nhất 24 giờ trước khi tiến hành, Điều tra viên báo cho Kiểm sát viên biết thời
51
+ gian, địa điểm nhận dạng, thực nghiệm điều tra, nhận biết giọng nói. Kiểm sát
52
+ viên phải có mặt để kiểm sát. Điều tra viên và Kiểm sát viên phối hợp kiểm tra,
53
+ đánh giá kết quả nhận dạng, thực nghiệm điều tra, nhận biết giọng nói để đề ra
54
+ các yêu cầu điều tra tiếp theo. Trường hợp vì lý do khách quan không có mặt để
55
+ kiểm sát trực tiếp thì Kiểm sát viên báo cho Điều tra viên trước khi tiến hành
56
+ 02 giờ.
57
+ - 'Khoản 2. Giám định viên, tổ chức được trưng cầu giám định có trách nhiệm như
58
+ sau: a) Giám định và ban hành kết luận giám định trong thời hạn 05 ngày kể từ
59
+ ngày nhận được quyết định trưng cầu giám định. Trường hợp không thể tiến hành
60
+ trong thời hạn thì kịp thời thông báo bằng văn bản để cơ quan trưng cầu giám định
61
+ biết, nêu rõ lý do, thời gian dự kiến ban hành kết luận giám định; b) Gửi kết
62
+ luận giám định cho cơ quan đã trưng cầu giám định trong thời hạn quy định tại
63
+ khoản 2 Điều 213 của Bộ luật Tố tụng hình sự; c) Kịp thời có mặt để thực hiện
64
+ kiểm tra dấu vết, thu mẫu giám định trong trường hợp quy định tại điểm a khoản
65
+ 1 Điều này; trường hợp không thể có mặt thì phải thông báo ngay và nêu rõ lý do
66
+ cho Điều tra viên biết; d) Khi tiến hành giám định, nếu thấy nội dung yêu cầu
67
+ giám định chưa rõ ràng thì yêu cầu cơ quan trưng cầu giám định giải thích và bổ
68
+ sung tài liệu. Khi cơ quan trưng cầu đề nghị, Giám định viên kịp thời giải thích
69
+ cụ thể các vấn đề trong kết luận giám định.'
70
+ - 'Điều 19. Hệ thống quay số mở thưởng điện tử 1. Hệ thống quay số mở thưởng điện
71
+ tử bao gồm: a) Thiết bị quay số mở thưởng tự động, bao gồm: Hệ thống phần cứng
72
+ và phần mềm quay số tự động; b) Hệ thống camera, màn hình phục vụ cho việc giám
73
+ sát được thiết bị quay số mở thưởng tự động. 2. Yêu cầu đối với thiết bị quay
74
+ số mở thưởng tự động: a) Có xuất xứ rõ ràng, đảm bảo các tiêu chuẩn và thông số
75
+ kỹ thuật theo đúng thiết kế của nhà sản xuất và được kiểm định bởi công ty kiểm
76
+ định độc lập; b) Vận hành an toàn, ổn định và đảm bảo hoàn toàn ngẫu nhiên, không
77
+ có bất kỳ sự can thiệp nào từ bên ngoài vào kết quả mở thưởng; c) Có ít nhất một
78
+ (01) thiết bị dự phòng; d) Được lắp đặt và vận hành tại khu vực riêng biệt và
79
+ được niêm phong trong suốt quá trình hoạt động để đảm bảo tất cả các đối tượng
80
+ không có nhiệm vụ không được can thiệp vào phần cứng, phần mềm của thiết bị quay
81
+ số mở thưởng tự động;'
82
+ - source_sentence: Bộ Tài chính quy định thế nào về thành phần và cấu trúc của Hội
83
+ đồng giám sát xổ số trong công ty xổ số điện toán?
84
+ sentences:
85
+ - 'Khoản 2. Thành phần Hội đồng giám sát xổ số bao gồm Chủ tịch, một số Phó chủ
86
+ tịch và các thành viên Hội đồng giám sát xổ số như sau: a) Chủ tịch Hội đồng giám
87
+ sát xổ số: là Chủ tịch hoặc Tổng giám đốc của công ty xổ số điện toán; b) Phó
88
+ chủ tịch Hội đồng giám sát xổ số: là Phó tổng giám đốc hoặc Kế toán trưởng của
89
+ công ty xổ số điện toán; c) Các thành viên Hội đồng giám sát xổ số: là lãnh đạo
90
+ một số phòng, ban nghiệp vụ của công ty xổ số điện toán; d) Công ty xổ số điện
91
+ toán có thể mời đại diện một số tổ chức chính trị - xã hội tham gia Hội đồng giám
92
+ sát xổ số với vai trò là thành viên Hội đồng giám sát xổ số.'
93
+ - 'Điều 9. Công nhận điều chỉnh hạng, công nhận lại hạng nhà chung cư 1. Việc công
94
+ nhận điều chỉnh hạng hoặc công nhận lại hạng nhà chung cư được thực hiện theo
95
+ đề nghị của tổ chức, cá nhân quy định tại Điều 4 của Thông tư này. 2. Trường hợp
96
+ quyết định công nhận hạng nhà chung cư chưa hết thời hạn theo quy định mà tổ chức,
97
+ cá nhân quy định tại Điều 4 của Thông tư có nhu cầu điều chỉnh hạng nhà chung
98
+ cư thì phải nộp 01 bộ hồ sơ quy định tại Khoản 3 Điều này tại Sở Xây dựng để được
99
+ xem xét, kiểm tra và công nhận điều chỉnh hạng nhà chung cư. Trình tự, thủ tục
100
+ công nhận điều chỉnh hạng nhà chung cư được thực hiện theo quy định tại Khoản
101
+ 2 Điều 8 của Thông tư này. Khi giao quyết định công nhận hạng nhà chung cư (đã
102
+ điều chỉnh), Sở Xây dựng phải thu hồi bản gốc quyết định công nhận hạng đang còn
103
+ thời hạn để lưu hồ sơ và đăng tải thông tin, văn bản quyết định trên Cổng thông
104
+ tin điện tử của Sở Xây dựng. 3. Hồ sơ đề nghị điều chỉnh hạng nhà chung cư bao
105
+ gồm: a) Đơn đề nghị điều chỉnh hạng nhà chung cư theo mẫu hướng dẫn tham khảo
106
+ quy định tại phụ lục số 03 ban hành kèm theo Thông tư này;'
107
+ - Điều 7. Hồ sơ đề nghị công nhận hạng nhà chung cư 1. Đơn đề nghị công nhận hạng
108
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 03 ban hành
109
+ kèm theo Thông tư này. 2. Bản sao có chứng thực Giấy phép xây dựng nhà chung cư
110
+ (đối với nhà chung cư thuộc diện phải có Giấy phép xây dựng theo quy định của
111
+ pháp luật về xây dựng). 3. Bản sao có chứng thực quyết định phê duyệt quy hoạch
112
+ chi tiết tỷ lệ 1/500 hoặc văn bản chấp thuận tổng mặt bằng khu vực có nhà chung
113
+ cư (đối với trường hợp không phải lập quy hoạch chi tiết tỷ lệ 1/500) kèm theo
114
+ bản vẽ tổng mặt bằng nhà chung cư đã được cơ quan có thẩm quyền phê duyệt. 4.
115
+ Bản sao có chứng thực văn bản thẩm định của cơ quan có thẩm quyền kèm theo bản
116
+ vẽ thiết kế cơ sở nhà chung cư theo quy định của pháp luật về xây dựng. 5. Bản
117
+ sao có chứng thực văn bản thông báo kết quả kiểm tra công tác nghiệm thu hoàn
118
+ thành công trình nhà chung cư của cơ quan chuyên môn về xây dựng. 6. Bản tự kê
119
+ khai, đánh giá phân hạng nhà chung cư của tổ chức, cá nhân đề nghị công nhận hạng
120
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 04 ban hành
121
+ kèm theo Thông tư này.
122
+ - source_sentence: Nếu đại lý xổ số tự chọn số điện toán không vận hành thiết bị bán
123
+ vé đúng hướng dẫn, họ sẽ phải chịu trách nhiệm gì?
124
+ sentences:
125
+ - 'Khoản 1. Tổ chức vận hành hệ thống xổ số tự chọn số điện toán: a) Công ty xổ
126
+ số điện toán chịu trách nhiệm tổ chức quản lý và vận hành hệ thống xổ số tự chọn
127
+ số điện toán theo quy định của pháp luật. Các đại lý xổ số tự chọn số điện toán
128
+ vận hành các thiết bị bán vé xổ số tự chọn số điện toán theo hướng dẫn của công
129
+ ty xổ số điện toán và chịu trách nhiệm về các thiết bị được giao quản lý theo
130
+ hợp đồng ký kết giữa các bên. Các doanh nghiệp cung cấp dịch vụ mạng xã hội trực
131
+ tuyến, doanh nghiệp viễn thông tham gia vào hoạt động kinh doanh xổ số tự chọn
132
+ số điện toán chịu trách nhiệm đảm bảo an ninh mạng, an toàn thông tin theo quy
133
+ định của pháp luật; b) Hệ thống xổ số tự chọn số điện toán (máy chủ, thiết bị
134
+ đầu cuối và các thiết bị đồng bộ khác) phải được kiểm tra, bảo dưỡng, bảo trì
135
+ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán để đảm
136
+ bảo yêu cầu vận hành an toàn, chính xác;'
137
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
138
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
139
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
140
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
141
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
142
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
143
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
144
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
145
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
146
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
147
+ mở thưởng trên thực tế.'
148
+ - 'Khoản 3. Cấp công trình của một tổ hợp các công trình hoặc một dây chuyền công
149
+ nghệ gồm nhiều hạng mục được xác định như sau: a) Trường hợp tổ hợp các công trình
150
+ hoặc dây chuyền công nghệ gồm nhiều hạng mục có quy định trong Phụ lục I Thông
151
+ tư này thì cấp công trình được xác định theo Phụ lục I Thông tư này; b) Trường
152
+ hợp tổ hợp các công trình hoặc dây chuyền công nghệ gồm nhiều hạng mục không quy
153
+ định trong Phụ lục I Thông tư này thì cấp công trình được xác định theo cấp của
154
+ công trình chính (thuộc tổ hợp các công trình hoặc dây chuyền công nghệ) có cấp
155
+ cao nhất. Cấp của công trình chính xác định theo quy định tại khoản 2 Điều này.'
156
+ - source_sentence: Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo
157
+ dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?
158
+ sentences:
159
+ - Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục
160
+ Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì,
161
+ phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành
162
+ có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận
163
+ hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực
164
+ thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ
165
+ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân
166
+ hạng và công nhận hạng nhà chung cư trên địa bàn.
167
+ - đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của
168
+ nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng
169
+ một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở
170
+ thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng.
171
+ Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi
172
+ (60) ngày, kể từ ngày quay số mở thưởng.
173
+ - 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu
174
+ chí sau: a) Mức độ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc
175
+ lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng
176
+ mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại
177
+ Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập
178
+ thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ
179
+ lục II Thông tư này.'
180
+ pipeline_tag: sentence-similarity
181
+ library_name: sentence-transformers
182
+ ---
183
+
184
+ # SentenceTransformer based on Qwen/Qwen3-Embedding-4B
185
+
186
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B). It maps sentences & paragraphs to a 2560-dimensional dense vector space and can be used for retrieval.
187
+
188
+ ## Model Details
189
+
190
+ ### Model Description
191
+ - **Model Type:** Sentence Transformer
192
+ - **Base model:** [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B) <!-- at revision 5cf2132abc99cad020ac570b19d031efec650f2b -->
193
+ - **Maximum Sequence Length:** 40960 tokens
194
+ - **Output Dimensionality:** 2560 dimensions
195
+ - **Similarity Function:** Cosine Similarity
196
+ - **Supported Modality:** Text
197
+ <!-- - **Training Dataset:** Unknown -->
198
+ <!-- - **Language:** Unknown -->
199
+ <!-- - **License:** Unknown -->
200
+
201
+ ### Model Sources
202
+
203
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
204
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
205
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
206
+
207
+ ### Full Model Architecture
208
+
209
+ ```
210
+ SentenceTransformer(
211
+ (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'Qwen3Model'})
212
+ (1): Pooling({'embedding_dimension': 2560, 'pooling_mode': 'lasttoken', 'include_prompt': True})
213
+ (2): Normalize({})
214
+ )
215
+ ```
216
+
217
+ ## Usage
218
+
219
+ ### Direct Usage (Sentence Transformers)
220
+
221
+ First install the Sentence Transformers library:
222
+
223
+ ```bash
224
+ pip install -U sentence-transformers
225
+ ```
226
+ Then you can load this model and run inference.
227
+ ```python
228
+ from sentence_transformers import SentenceTransformer
229
+
230
+ # Download from the 🤗 Hub
231
+ model = SentenceTransformer("sentence_transformers_model_id")
232
+ # Run inference
233
+ queries = [
234
+ 'Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?',
235
+ ]
236
+ documents = [
237
+ 'đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng. Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi (60) ngày, kể từ ngày quay số mở thưởng.',
238
+ 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu chí sau: a) Mức ��ộ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ lục II Thông tư này.',
239
+ 'Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên địa bàn.',
240
+ ]
241
+ query_embeddings = model.encode_query(queries)
242
+ document_embeddings = model.encode_document(documents)
243
+ print(query_embeddings.shape, document_embeddings.shape)
244
+ # [1, 2560] [3, 2560]
245
+
246
+ # Get the similarity scores for the embeddings
247
+ similarities = model.similarity(query_embeddings, document_embeddings)
248
+ print(similarities)
249
+ # tensor([[ 0.6940, -0.0194, 0.1404]])
250
+ ```
251
+ <!--
252
+ ### Direct Usage (Transformers)
253
+
254
+ <details><summary>Click to see the direct usage in Transformers</summary>
255
+
256
+ </details>
257
+ -->
258
+
259
+ <!--
260
+ ### Downstream Usage (Sentence Transformers)
261
+
262
+ You can finetune this model on your own dataset.
263
+
264
+ <details><summary>Click to expand</summary>
265
+
266
+ </details>
267
+ -->
268
+
269
+ <!--
270
+ ### Out-of-Scope Use
271
+
272
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
273
+ -->
274
+
275
+ <!--
276
+ ## Bias, Risks and Limitations
277
+
278
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
279
+ -->
280
+
281
+ <!--
282
+ ### Recommendations
283
+
284
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
285
+ -->
286
+
287
+ ## Training Details
288
+
289
+ ### Training Dataset
290
+
291
+ #### Unnamed Dataset
292
+
293
+ * Size: 507,152 training samples
294
+ * Columns: <code>anchor</code> and <code>positive</code>
295
+ * Approximate statistics based on the first 1000 samples:
296
+ | | anchor | positive |
297
+ |:--------|:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------|
298
+ | type | string | string |
299
+ | details | <ul><li>min: 43 characters</li><li>mean: 117.84 characters</li><li>max: 318 characters</li></ul> | <ul><li>min: 444 characters</li><li>mean: 790.51 characters</li><li>max: 1195 characters</li></ul> |
300
+ * Samples:
301
+ | anchor | positive |
302
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
303
+ | <code>Bộ Giao thông vận tải quy định các đơn vị kinh doanh vận tải nào phải lắp đặt thiết bị giám sát hành trình trên xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
304
+ | <code>Bộ Giao thông vận tải giải thích như thế nào về các từ ngữ như 'hệ thống thông tin' và 'dữ liệu' trong quy định về thiết bị giám sát hành trình?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
305
+ | <code>Pháp luật quy định như thế nào về việc thu nhận, quản lý và khai thác dữ liệu từ thiết bị giám sát hành trình của xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát h��nh trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
306
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
307
+ ```json
308
+ {
309
+ "scale": 20.0,
310
+ "similarity_fct": "cos_sim",
311
+ "mini_batch_size": 16,
312
+ "gather_across_devices": false,
313
+ "directions": [
314
+ "query_to_doc"
315
+ ],
316
+ "partition_mode": "joint",
317
+ "hardness_mode": null,
318
+ "hardness_strength": 0.0
319
+ }
320
+ ```
321
+
322
+ ### Training Hyperparameters
323
+ #### Non-Default Hyperparameters
324
+
325
+ - `per_device_train_batch_size`: 1024
326
+ - `num_train_epochs`: 2
327
+ - `learning_rate`: 2e-05
328
+ - `lr_scheduler_type`: constant_with_warmup
329
+ - `warmup_steps`: 0.1
330
+ - `bf16`: True
331
+ - `dataloader_num_workers`: 8
332
+ - `dataloader_persistent_workers`: True
333
+ - `remove_unused_columns`: False
334
+ - `ddp_find_unused_parameters`: False
335
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
336
+ Query:
337
+ - `batch_sampler`: no_duplicates
338
+
339
+ #### All Hyperparameters
340
+ <details><summary>Click to expand</summary>
341
+
342
+ - `per_device_train_batch_size`: 1024
343
+ - `num_train_epochs`: 2
344
+ - `max_steps`: -1
345
+ - `learning_rate`: 2e-05
346
+ - `lr_scheduler_type`: constant_with_warmup
347
+ - `lr_scheduler_kwargs`: None
348
+ - `warmup_steps`: 0.1
349
+ - `optim`: adamw_torch_fused
350
+ - `optim_args`: None
351
+ - `weight_decay`: 0.0
352
+ - `adam_beta1`: 0.9
353
+ - `adam_beta2`: 0.999
354
+ - `adam_epsilon`: 1e-08
355
+ - `optim_target_modules`: None
356
+ - `gradient_accumulation_steps`: 1
357
+ - `average_tokens_across_devices`: True
358
+ - `max_grad_norm`: 1.0
359
+ - `label_smoothing_factor`: 0.0
360
+ - `bf16`: True
361
+ - `fp16`: False
362
+ - `bf16_full_eval`: False
363
+ - `fp16_full_eval`: False
364
+ - `tf32`: None
365
+ - `gradient_checkpointing`: False
366
+ - `gradient_checkpointing_kwargs`: None
367
+ - `torch_compile`: False
368
+ - `torch_compile_backend`: None
369
+ - `torch_compile_mode`: None
370
+ - `use_liger_kernel`: False
371
+ - `liger_kernel_config`: None
372
+ - `use_cache`: False
373
+ - `neftune_noise_alpha`: None
374
+ - `torch_empty_cache_steps`: None
375
+ - `auto_find_batch_size`: False
376
+ - `log_on_each_node`: True
377
+ - `logging_nan_inf_filter`: True
378
+ - `include_num_input_tokens_seen`: no
379
+ - `log_level`: passive
380
+ - `log_level_replica`: warning
381
+ - `disable_tqdm`: False
382
+ - `project`: huggingface
383
+ - `trackio_space_id`: trackio
384
+ - `per_device_eval_batch_size`: 8
385
+ - `prediction_loss_only`: True
386
+ - `eval_on_start`: False
387
+ - `eval_do_concat_batches`: True
388
+ - `eval_use_gather_object`: False
389
+ - `eval_accumulation_steps`: None
390
+ - `include_for_metrics`: []
391
+ - `batch_eval_metrics`: False
392
+ - `save_only_model`: False
393
+ - `save_on_each_node`: False
394
+ - `enable_jit_checkpoint`: False
395
+ - `push_to_hub`: False
396
+ - `hub_private_repo`: None
397
+ - `hub_model_id`: None
398
+ - `hub_strategy`: every_save
399
+ - `hub_always_push`: False
400
+ - `hub_revision`: None
401
+ - `load_best_model_at_end`: False
402
+ - `ignore_data_skip`: False
403
+ - `restore_callback_states_from_checkpoint`: False
404
+ - `full_determinism`: False
405
+ - `seed`: 42
406
+ - `data_seed`: None
407
+ - `use_cpu`: False
408
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
409
+ - `parallelism_config`: None
410
+ - `dataloader_drop_last`: True
411
+ - `dataloader_num_workers`: 8
412
+ - `dataloader_pin_memory`: True
413
+ - `dataloader_persistent_workers`: True
414
+ - `dataloader_prefetch_factor`: None
415
+ - `remove_unused_columns`: False
416
+ - `label_names`: None
417
+ - `train_sampling_strategy`: random
418
+ - `length_column_name`: length
419
+ - `ddp_find_unused_parameters`: False
420
+ - `ddp_bucket_cap_mb`: None
421
+ - `ddp_broadcast_buffers`: False
422
+ - `ddp_backend`: None
423
+ - `ddp_timeout`: 1800
424
+ - `fsdp`: []
425
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
426
+ - `deepspeed`: None
427
+ - `debug`: []
428
+ - `skip_memory_metrics`: True
429
+ - `do_predict`: False
430
+ - `resume_from_checkpoint`: None
431
+ - `warmup_ratio`: None
432
+ - `local_rank`: -1
433
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
434
+ Query:
435
+ - `batch_sampler`: no_duplicates
436
+ - `multi_dataset_batch_sampler`: proportional
437
+ - `router_mapping`: {}
438
+ - `learning_rate_mapping`: {}
439
+
440
+ </details>
441
+
442
+ ### Training Logs
443
+ | Epoch | Step | Training Loss |
444
+ |:------:|:----:|:-------------:|
445
+ | 0.0813 | 10 | 0.3239 |
446
+ | 0.1626 | 20 | 0.3034 |
447
+ | 0.2439 | 30 | 0.2333 |
448
+ | 0.3252 | 40 | 0.1800 |
449
+ | 0.4065 | 50 | 0.1686 |
450
+ | 0.4878 | 60 | 0.1541 |
451
+ | 0.5691 | 70 | 0.1425 |
452
+ | 0.6504 | 80 | 0.1341 |
453
+ | 0.7317 | 90 | 0.1300 |
454
+ | 0.8130 | 100 | 0.1205 |
455
+ | 0.8943 | 110 | 0.1214 |
456
+ | 0.9756 | 120 | 0.1174 |
457
+
458
+
459
+ ### Training Time
460
+ - **Training**: 1.3 hours
461
+
462
+ ### Framework Versions
463
+ - Python: 3.10.20
464
+ - Sentence Transformers: 5.4.1
465
+ - Transformers: 5.5.4
466
+ - PyTorch: 2.9.1+cu130
467
+ - Accelerate: 1.13.0
468
+ - Datasets: 4.8.4
469
+ - Tokenizers: 0.22.2
470
+
471
+ ## Citation
472
+
473
+ ### BibTeX
474
+
475
+ #### Sentence Transformers
476
+ ```bibtex
477
+ @inproceedings{reimers-2019-sentence-bert,
478
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
479
+ author = "Reimers, Nils and Gurevych, Iryna",
480
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
481
+ month = "11",
482
+ year = "2019",
483
+ publisher = "Association for Computational Linguistics",
484
+ url = "https://arxiv.org/abs/1908.10084",
485
+ }
486
+ ```
487
+
488
+ #### CachedMultipleNegativesRankingLoss
489
+ ```bibtex
490
+ @misc{gao2021scaling,
491
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
492
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
493
+ year={2021},
494
+ eprint={2101.06983},
495
+ archivePrefix={arXiv},
496
+ primaryClass={cs.LG}
497
+ }
498
+ ```
499
+
500
+ <!--
501
+ ## Glossary
502
+
503
+ *Clearly define terms in order to be accessible across audiences.*
504
+ -->
505
+
506
+ <!--
507
+ ## Model Card Authors
508
+
509
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
510
+ -->
511
+
512
+ <!--
513
+ ## Model Card Contact
514
+
515
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
516
+ -->
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/adapter_config.json ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alora_invocation_tokens": null,
3
+ "alpha_pattern": {},
4
+ "arrow_config": null,
5
+ "auto_mapping": null,
6
+ "base_model_name_or_path": "Qwen/Qwen3-Embedding-4B",
7
+ "bias": "none",
8
+ "corda_config": null,
9
+ "ensure_weight_tying": false,
10
+ "eva_config": null,
11
+ "exclude_modules": null,
12
+ "fan_in_fan_out": false,
13
+ "inference_mode": false,
14
+ "init_lora_weights": true,
15
+ "layer_replication": null,
16
+ "layers_pattern": null,
17
+ "layers_to_transform": null,
18
+ "loftq_config": {},
19
+ "lora_alpha": 32,
20
+ "lora_bias": false,
21
+ "lora_dropout": 0,
22
+ "lora_ga_config": null,
23
+ "megatron_config": null,
24
+ "megatron_core": "megatron.core",
25
+ "modules_to_save": null,
26
+ "peft_type": "LORA",
27
+ "peft_version": "0.19.1",
28
+ "qalora_group_size": 16,
29
+ "r": 32,
30
+ "rank_pattern": {},
31
+ "revision": null,
32
+ "target_modules": [
33
+ "q_proj",
34
+ "up_proj",
35
+ "o_proj",
36
+ "gate_proj",
37
+ "v_proj",
38
+ "down_proj",
39
+ "k_proj"
40
+ ],
41
+ "target_parameters": null,
42
+ "task_type": "FEATURE_EXTRACTION",
43
+ "trainable_token_indices": null,
44
+ "use_bdlora": null,
45
+ "use_dora": false,
46
+ "use_qalora": false,
47
+ "use_rslora": false
48
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/adapter_model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ed4f760be0a1e5166fb875a97c3a2a5465403342c79350d9651669cd3036ea81
3
+ size 132185368
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/chat_template.jinja ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {%- if tools %}
2
+ {{- '<|im_start|>system\n' }}
3
+ {%- if messages[0]['role'] == 'system' %}
4
+ {{- messages[0]['content'] }}
5
+ {%- else %}
6
+ {{- 'You are a helpful assistant.' }}
7
+ {%- endif %}
8
+ {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
9
+ {%- for tool in tools %}
10
+ {{- "\n" }}
11
+ {{- tool | tojson }}
12
+ {%- endfor %}
13
+ {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
14
+ {%- else %}
15
+ {%- if messages[0]['role'] == 'system' %}
16
+ {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
17
+ {%- else %}
18
+ {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
19
+ {%- endif %}
20
+ {%- endif %}
21
+ {%- for message in messages %}
22
+ {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
23
+ {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
24
+ {%- elif message.role == "assistant" %}
25
+ {{- '<|im_start|>' + message.role }}
26
+ {%- if message.content %}
27
+ {{- '\n' + message.content }}
28
+ {%- endif %}
29
+ {%- for tool_call in message.tool_calls %}
30
+ {%- if tool_call.function is defined %}
31
+ {%- set tool_call = tool_call.function %}
32
+ {%- endif %}
33
+ {{- '\n<tool_call>\n{"name": "' }}
34
+ {{- tool_call.name }}
35
+ {{- '", "arguments": ' }}
36
+ {{- tool_call.arguments | tojson }}
37
+ {{- '}\n</tool_call>' }}
38
+ {%- endfor %}
39
+ {{- '<|im_end|>\n' }}
40
+ {%- elif message.role == "tool" %}
41
+ {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
42
+ {{- '<|im_start|>user' }}
43
+ {%- endif %}
44
+ {{- '\n<tool_response>\n' }}
45
+ {{- message.content }}
46
+ {{- '\n</tool_response>' }}
47
+ {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
48
+ {{- '<|im_end|>\n' }}
49
+ {%- endif %}
50
+ {%- endif %}
51
+ {%- endfor %}
52
+ {%- if add_generation_prompt %}
53
+ {{- '<|im_start|>assistant\n' }}
54
+ {%- endif %}
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "pytorch": "2.9.1+cu130",
4
+ "sentence_transformers": "5.4.1",
5
+ "transformers": "5.5.4"
6
+ },
7
+ "default_prompt_name": null,
8
+ "model_type": "SentenceTransformer",
9
+ "prompts": {
10
+ "document": "",
11
+ "query": "Instruct: Given a web search query, retrieve relevant passages that answer the query\nQuery:"
12
+ },
13
+ "similarity_fn_name": "cosine"
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.base.modules.transformer.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
19
+ }
20
+ ]
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b3b6380469529fe254800418ae9d15d1da4871fd8c79a1df8c9c37e64af57ddd
3
+ size 264674251
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_0.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6754f664f73efa70f79c00b99567d387234384820b8fe10b313e462de77b8495
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_1.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:db75971c39cd9a194e48b017859bc96478c7734213705d9213b5bb398c16cf54
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_2.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:606bca044465082465b0f44b2f8315a6df4e738e2a406d5b81b59cc5aadf2667
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/rng_state_3.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6dfefabd447bd433f4faeee2129889d982e2f2585380bd4ee0e3378aa632419a
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9c73dd7da5b99f5396fb5b6eaa61afaf0bfea04a37887d0d960e505cdaeb2adb
3
+ size 1465
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/sentence_bert_config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "transformer_task": "feature-extraction",
3
+ "modality_config": {
4
+ "text": {
5
+ "method": "forward",
6
+ "method_output_name": "last_hidden_state"
7
+ }
8
+ },
9
+ "module_output_name": "token_embeddings"
10
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:57da8061b845087a819ca0dc7d5d0ce75a5ba7a597946911fbf12b3b461e5b6b
3
+ size 11423043
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": false,
3
+ "backend": "tokenizers",
4
+ "bos_token": null,
5
+ "clean_up_tokenization_spaces": false,
6
+ "eos_token": "<|im_end|>",
7
+ "errors": "replace",
8
+ "is_local": false,
9
+ "model_max_length": 40960,
10
+ "pad_token": "<|endoftext|>",
11
+ "split_special_tokens": false,
12
+ "tokenizer_class": "Qwen2Tokenizer",
13
+ "unk_token": null
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/trainer_state.json ADDED
@@ -0,0 +1,118 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_global_step": null,
3
+ "best_metric": null,
4
+ "best_model_checkpoint": null,
5
+ "epoch": 1.0,
6
+ "eval_steps": 500,
7
+ "global_step": 123,
8
+ "is_hyper_param_search": false,
9
+ "is_local_process_zero": true,
10
+ "is_world_process_zero": true,
11
+ "log_history": [
12
+ {
13
+ "epoch": 0.08130081300813008,
14
+ "grad_norm": 0.400390625,
15
+ "learning_rate": 7.2000000000000005e-06,
16
+ "loss": 0.3238831043243408,
17
+ "step": 10
18
+ },
19
+ {
20
+ "epoch": 0.16260162601626016,
21
+ "grad_norm": 0.29296875,
22
+ "learning_rate": 1.5200000000000002e-05,
23
+ "loss": 0.30339827537536623,
24
+ "step": 20
25
+ },
26
+ {
27
+ "epoch": 0.24390243902439024,
28
+ "grad_norm": 0.1435546875,
29
+ "learning_rate": 2e-05,
30
+ "loss": 0.2333136796951294,
31
+ "step": 30
32
+ },
33
+ {
34
+ "epoch": 0.3252032520325203,
35
+ "grad_norm": 0.09423828125,
36
+ "learning_rate": 2e-05,
37
+ "loss": 0.18001788854599,
38
+ "step": 40
39
+ },
40
+ {
41
+ "epoch": 0.4065040650406504,
42
+ "grad_norm": 0.08544921875,
43
+ "learning_rate": 2e-05,
44
+ "loss": 0.16857454776763917,
45
+ "step": 50
46
+ },
47
+ {
48
+ "epoch": 0.4878048780487805,
49
+ "grad_norm": 0.06494140625,
50
+ "learning_rate": 2e-05,
51
+ "loss": 0.15414767265319823,
52
+ "step": 60
53
+ },
54
+ {
55
+ "epoch": 0.5691056910569106,
56
+ "grad_norm": 0.0634765625,
57
+ "learning_rate": 2e-05,
58
+ "loss": 0.1425204634666443,
59
+ "step": 70
60
+ },
61
+ {
62
+ "epoch": 0.6504065040650406,
63
+ "grad_norm": 0.06396484375,
64
+ "learning_rate": 2e-05,
65
+ "loss": 0.13414767980575562,
66
+ "step": 80
67
+ },
68
+ {
69
+ "epoch": 0.7317073170731707,
70
+ "grad_norm": 0.060791015625,
71
+ "learning_rate": 2e-05,
72
+ "loss": 0.12999284267425537,
73
+ "step": 90
74
+ },
75
+ {
76
+ "epoch": 0.8130081300813008,
77
+ "grad_norm": 0.056396484375,
78
+ "learning_rate": 2e-05,
79
+ "loss": 0.12052559852600098,
80
+ "step": 100
81
+ },
82
+ {
83
+ "epoch": 0.8943089430894309,
84
+ "grad_norm": 0.056640625,
85
+ "learning_rate": 2e-05,
86
+ "loss": 0.12136286497116089,
87
+ "step": 110
88
+ },
89
+ {
90
+ "epoch": 0.975609756097561,
91
+ "grad_norm": 0.06005859375,
92
+ "learning_rate": 2e-05,
93
+ "loss": 0.11741914749145507,
94
+ "step": 120
95
+ }
96
+ ],
97
+ "logging_steps": 10,
98
+ "max_steps": 246,
99
+ "num_input_tokens_seen": 0,
100
+ "num_train_epochs": 2,
101
+ "save_steps": 500,
102
+ "stateful_callbacks": {
103
+ "TrainerControl": {
104
+ "args": {
105
+ "should_epoch_stop": false,
106
+ "should_evaluate": false,
107
+ "should_log": false,
108
+ "should_save": true,
109
+ "should_training_stop": false
110
+ },
111
+ "attributes": {}
112
+ }
113
+ },
114
+ "total_flos": 0.0,
115
+ "train_batch_size": 1024,
116
+ "trial_name": null,
117
+ "trial_params": null
118
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-123/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9075a2b1e72c2618e63ed5cd6f52b9860b8916fa429eb31e18615fa7b48b5370
3
+ size 5713
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/1_Pooling/config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "embedding_dimension": 2560,
3
+ "pooling_mode": "lasttoken",
4
+ "include_prompt": true
5
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/README.md ADDED
@@ -0,0 +1,528 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:507152
8
+ - loss:CachedMultipleNegativesRankingLoss
9
+ base_model: Qwen/Qwen3-Embedding-4B
10
+ widget:
11
+ - source_sentence: Nếu một người vi phạm các quy định về vệ sinh nơi công cộng, họ
12
+ sẽ bị xử lý như thế nào?
13
+ sentences:
14
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
15
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
16
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
17
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
18
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
19
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
20
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
21
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
22
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
23
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
24
+ mở thưởng trên thực tế.'
25
+ - Chương 10. KHEN THƯỞNG VÀ XỬ LÝ CÁC VI PHẠM Điều 52. Khen thưởng.. Địa phương,
26
+ đơn vị, cá nhân có thành tích trong công tác bảo vệ sức khoẻ nhân dân được Nhà
27
+ nước khen thưởng vật chất và tinh thần. Thầy thuốc, lương y, dược sĩ và nhân viên
28
+ y tế khác có nhiều cống hiến trong sự nghiệp bảo vệ sức khoẻ nhân dân, có trình
29
+ độ nghiệp vụ, chuyên môn kỹ thuật giỏi, có đạo đức, được nhân dân và đồng nghiệp
30
+ tín nhiệm thì được xét tặng danh hiệu cao quý của Nhà nước. Điều 53. Xử lý các
31
+ vi phạm. Người nào có những hành vi sau đây thì tuỳ theo mức độ nhẹ hoặc nặng
32
+ sẽ bị xứ lý kỷ luật, bị xử lý hành chính hoặc bị truy cứu trách nhiệm hình sự.
33
+ 1- Vi phạm các quy định về giữ gìn vệ sinh nơi công cộng, phòng và chống dịch,
34
+ bệnh. 2- Vi phạm các quy định về khám bệnh, chữa bệnh, sản xuất thuốc và bán thuốc.
35
+ 3- Vi phạm các quy định về vệ sinh lương thực, thực phẩm, vệ sinh lao động và
36
+ các quy định khác của Luật bảo vệ sức khoẻ nhân dân.
37
+ - Điều 4. Mẫu các văn bản ban hành kèm theo Thông tư liên tịch 1. Đơn xin hoãn,
38
+ miễn chấp hành án phạt tù (Mẫu số 01). 2. Quyết định hoãn chấp hành án phạt tù
39
+ (Mẫu số 02). 3. Quyết định hủy Quyết định hoãn chấp hành án phạt tù (Mẫu số 03).
40
+ 4. Quyết định hủy Quyết định hoãn chấp hành án phạt tù và áp dụng biện pháp bắt
41
+ buộc chữa bệnh (Mẫu số 04). 5. Quyết định mở phiên họp xem xét miễn chấp hành
42
+ án phạt tù (Mẫu số 05). 6. Quyết định về việc xét miễn chấp hành án phạt tù (Mẫu
43
+ số 06).
44
+ - source_sentence: Trước khi tiến hành nhận dạng, thực nghiệm điều tra, nhận biết
45
+ giọng nói, Điều tra viên phải thông báo cho Kiểm sát viên biết trước bao nhiêu
46
+ giờ?
47
+ sentences:
48
+ - Khoản 1. Việc nhận dạng, thực nghiệm điều tra, nhận biết giọng nói được thực hiện
49
+ theo quy định tại các điều 190, 191, 204 và 421 của Bộ luật Tố tụng hình sự. Chậm
50
+ nhất 24 giờ trước khi tiến hành, Điều tra viên báo cho Kiểm sát viên biết thời
51
+ gian, địa điểm nhận dạng, thực nghiệm điều tra, nhận biết giọng nói. Kiểm sát
52
+ viên phải có mặt để kiểm sát. Điều tra viên và Kiểm sát viên phối hợp kiểm tra,
53
+ đánh giá kết quả nhận dạng, thực nghiệm điều tra, nhận biết giọng nói để đề ra
54
+ các yêu cầu điều tra tiếp theo. Trường hợp vì lý do khách quan không có mặt để
55
+ kiểm sát trực tiếp thì Kiểm sát viên báo cho Điều tra viên trước khi tiến hành
56
+ 02 giờ.
57
+ - 'Khoản 2. Giám định viên, tổ chức được trưng cầu giám định có trách nhiệm như
58
+ sau: a) Giám định và ban hành kết luận giám định trong thời hạn 05 ngày kể từ
59
+ ngày nhận được quyết định trưng cầu giám định. Trường hợp không thể tiến hành
60
+ trong thời hạn thì kịp thời thông báo bằng văn bản để cơ quan trưng cầu giám định
61
+ biết, nêu rõ lý do, thời gian dự kiến ban hành kết luận giám định; b) Gửi kết
62
+ luận giám định cho cơ quan đã trưng cầu giám định trong thời hạn quy định tại
63
+ khoản 2 Điều 213 của Bộ luật Tố tụng hình sự; c) Kịp thời có mặt để thực hiện
64
+ kiểm tra dấu vết, thu mẫu giám định trong trường hợp quy định tại điểm a khoản
65
+ 1 Điều này; trường hợp không thể có mặt thì phải thông báo ngay và nêu rõ lý do
66
+ cho Điều tra viên biết; d) Khi tiến hành giám định, nếu thấy nội dung yêu cầu
67
+ giám định chưa rõ ràng thì yêu cầu cơ quan trưng cầu giám định giải thích và bổ
68
+ sung tài liệu. Khi cơ quan trưng cầu đề nghị, Giám định viên kịp thời giải thích
69
+ cụ thể các vấn đề trong kết luận giám định.'
70
+ - 'Điều 19. Hệ thống quay số mở thưởng điện tử 1. Hệ thống quay số mở thưởng điện
71
+ tử bao gồm: a) Thiết bị quay số mở thưởng tự động, bao gồm: Hệ thống phần cứng
72
+ và phần mềm quay số tự động; b) Hệ thống camera, màn hình phục vụ cho việc giám
73
+ sát được thiết bị quay số mở thưởng tự động. 2. Yêu cầu đối với thiết bị quay
74
+ số mở thưởng tự động: a) Có xuất xứ rõ ràng, đảm bảo các tiêu chuẩn và thông số
75
+ kỹ thuật theo đúng thiết kế của nhà sản xuất và được kiểm định bởi công ty kiểm
76
+ định độc lập; b) Vận hành an toàn, ổn định và đảm bảo hoàn toàn ngẫu nhiên, không
77
+ có bất kỳ sự can thiệp nào từ bên ngoài vào kết quả mở thưởng; c) Có ít nhất một
78
+ (01) thiết bị dự phòng; d) Được lắp đặt và vận hành tại khu vực riêng biệt và
79
+ được niêm phong trong suốt quá trình hoạt động để đảm bảo tất cả các đối tượng
80
+ không có nhiệm vụ không được can thiệp vào phần cứng, phần mềm của thiết bị quay
81
+ số mở thưởng tự động;'
82
+ - source_sentence: Bộ Tài chính quy định thế nào về thành phần và cấu trúc của Hội
83
+ đồng giám sát xổ số trong công ty xổ số điện toán?
84
+ sentences:
85
+ - 'Khoản 2. Thành phần Hội đồng giám sát xổ số bao gồm Chủ tịch, một số Phó chủ
86
+ tịch và các thành viên Hội đồng giám sát xổ số như sau: a) Chủ tịch Hội đồng giám
87
+ sát xổ số: là Chủ tịch hoặc Tổng giám đốc của công ty xổ số điện toán; b) Phó
88
+ chủ tịch Hội đồng giám sát xổ số: là Phó tổng giám đốc hoặc Kế toán trưởng của
89
+ công ty xổ số điện toán; c) Các thành viên Hội đồng giám sát xổ số: là lãnh đạo
90
+ một số phòng, ban nghiệp vụ của công ty xổ số điện toán; d) Công ty xổ số điện
91
+ toán có thể mời đại diện một số tổ chức chính trị - xã hội tham gia Hội đồng giám
92
+ sát xổ số với vai trò là thành viên Hội đồng giám sát xổ số.'
93
+ - 'Điều 9. Công nhận điều chỉnh hạng, công nhận lại hạng nhà chung cư 1. Việc công
94
+ nhận điều chỉnh hạng hoặc công nhận lại hạng nhà chung cư được thực hiện theo
95
+ đề nghị của tổ chức, cá nhân quy định tại Điều 4 của Thông tư này. 2. Trường hợp
96
+ quyết định công nhận hạng nhà chung cư chưa hết thời hạn theo quy định mà tổ chức,
97
+ cá nhân quy định tại Điều 4 của Thông tư có nhu cầu điều chỉnh hạng nhà chung
98
+ cư thì phải nộp 01 bộ hồ sơ quy định tại Khoản 3 Điều này tại Sở Xây dựng để được
99
+ xem xét, kiểm tra và công nhận điều chỉnh hạng nhà chung cư. Trình tự, thủ tục
100
+ công nhận điều chỉnh hạng nhà chung cư được thực hiện theo quy định tại Khoản
101
+ 2 Điều 8 của Thông tư này. Khi giao quyết định công nhận hạng nhà chung cư (đã
102
+ điều chỉnh), Sở Xây dựng phải thu hồi bản gốc quyết định công nhận hạng đang còn
103
+ thời hạn để lưu hồ sơ và đăng tải thông tin, văn bản quyết định trên Cổng thông
104
+ tin điện tử của Sở Xây dựng. 3. Hồ sơ đề nghị điều chỉnh hạng nhà chung cư bao
105
+ gồm: a) Đơn đề nghị điều chỉnh hạng nhà chung cư theo mẫu hướng dẫn tham khảo
106
+ quy định tại phụ lục số 03 ban hành kèm theo Thông tư này;'
107
+ - Điều 7. Hồ sơ đề nghị công nhận hạng nhà chung cư 1. Đơn đề nghị công nhận hạng
108
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 03 ban hành
109
+ kèm theo Thông tư này. 2. Bản sao có chứng thực Giấy phép xây dựng nhà chung cư
110
+ (đối với nhà chung cư thuộc diện phải có Giấy phép xây dựng theo quy định của
111
+ pháp luật về xây dựng). 3. Bản sao có chứng thực quyết định phê duyệt quy hoạch
112
+ chi tiết tỷ lệ 1/500 hoặc văn bản chấp thuận tổng mặt bằng khu vực có nhà chung
113
+ cư (đối với trường hợp không phải lập quy hoạch chi tiết tỷ lệ 1/500) kèm theo
114
+ bản vẽ tổng mặt bằng nhà chung cư đã được cơ quan có thẩm quyền phê duyệt. 4.
115
+ Bản sao có chứng thực văn bản thẩm định của cơ quan có thẩm quyền kèm theo bản
116
+ vẽ thiết kế cơ sở nhà chung cư theo quy định của pháp luật về xây dựng. 5. Bản
117
+ sao có chứng thực văn bản thông báo kết quả kiểm tra công tác nghiệm thu hoàn
118
+ thành công trình nhà chung cư của cơ quan chuyên môn về xây dựng. 6. Bản tự kê
119
+ khai, đánh giá phân hạng nhà chung cư của tổ chức, cá nhân đề nghị công nhận hạng
120
+ nhà chung cư theo mẫu hướng dẫn tham khảo quy định tại phụ lục số 04 ban hành
121
+ kèm theo Thông tư này.
122
+ - source_sentence: Nếu đại lý xổ số tự chọn số điện toán không vận hành thiết bị bán
123
+ vé đúng hướng dẫn, họ sẽ phải chịu trách nhiệm gì?
124
+ sentences:
125
+ - 'Khoản 1. Tổ chức vận hành hệ thống xổ số tự chọn số điện toán: a) Công ty xổ
126
+ số điện toán chịu trách nhiệm tổ chức quản lý và vận hành hệ thống xổ số tự chọn
127
+ số điện toán theo quy định của pháp luật. Các đại lý xổ số tự chọn số điện toán
128
+ vận hành các thiết bị bán vé xổ số tự chọn số điện toán theo hướng dẫn của công
129
+ ty xổ số điện toán và chịu trách nhiệm về các thiết bị được giao quản lý theo
130
+ hợp đồng ký kết giữa các bên. Các doanh nghiệp cung cấp dịch vụ mạng xã hội trực
131
+ tuyến, doanh nghiệp viễn thông tham gia vào hoạt động kinh doanh xổ số tự chọn
132
+ số điện toán chịu trách nhiệm đảm bảo an ninh mạng, an toàn thông tin theo quy
133
+ định của pháp luật; b) Hệ thống xổ số tự chọn số điện toán (máy chủ, thiết bị
134
+ đầu cuối và các thiết bị đồng bộ khác) phải được kiểm tra, bảo dưỡng, bảo trì
135
+ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán để đảm
136
+ bảo yêu cầu vận hành an toàn, chính xác;'
137
+ - '2. Kiểm tra, xác nhận các nội dung liên quan đến công tác quay số mở thưởng bao
138
+ gồm: a) Đối với hình thức quay số mở thưởng bằng lồng cầu: - Kiểm tra, xác nhận
139
+ Hội đồng giám sát xổ số đã thực hiện nhiệm vụ kiểm tra việc khóa máy chủ để đảm
140
+ bảo toàn bộ hệ thống không phát hành được vé ngay sau thời điểm kết thúc thời
141
+ gian phát hành; - Kiểm tra, xác nhận việc tuân thủ quy trình quay số mở thưởng
142
+ được quy định tại Thể lệ quay số mở thưởng đã được công bố công khai và quy định
143
+ tại Thông tư này; - Kiểm tra, xác nhận công ty xổ số điện toán ký xác nhận bảng
144
+ tổng hợp doanh thu; - Kiểm tra, xác nhận việc sao lưu và niêm phong dữ liệu bộ
145
+ số dự thưởng của các kỳ quay số mở thưởng; - Kiểm tra, xác nhận việc xác nhận
146
+ kết quả quay số mở thưởng của Hội đồng giám sát trùng khớp với kết quả quay số
147
+ mở thưởng trên thực tế.'
148
+ - 'Khoản 3. Cấp công trình của một tổ hợp các công trình hoặc một dây chuyền công
149
+ nghệ gồm nhiều hạng mục được xác định như sau: a) Trường hợp tổ hợp các công trình
150
+ hoặc dây chuyền công nghệ gồm nhiều hạng mục có quy định trong Phụ lục I Thông
151
+ tư này thì cấp công trình được xác định theo Phụ lục I Thông tư này; b) Trường
152
+ hợp tổ hợp các công trình hoặc dây chuyền công nghệ gồm nhiều hạng mục không quy
153
+ định trong Phụ lục I Thông tư này thì cấp công trình được xác định theo cấp của
154
+ công trình chính (thuộc tổ hợp các công trình hoặc dây chuyền công nghệ) có cấp
155
+ cao nhất. Cấp của công trình chính xác định theo quy định tại khoản 2 Điều này.'
156
+ - source_sentence: Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo
157
+ dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?
158
+ sentences:
159
+ - Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục
160
+ Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì,
161
+ phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành
162
+ có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận
163
+ hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực
164
+ thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ
165
+ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân
166
+ hạng và công nhận hạng nhà chung cư trên địa bàn.
167
+ - đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của
168
+ nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng
169
+ một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở
170
+ thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng.
171
+ Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi
172
+ (60) ngày, kể từ ngày quay số mở thưởng.
173
+ - 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu
174
+ chí sau: a) Mức độ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc
175
+ lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng
176
+ mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại
177
+ Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập
178
+ thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ
179
+ lục II Thông tư này.'
180
+ pipeline_tag: sentence-similarity
181
+ library_name: sentence-transformers
182
+ ---
183
+
184
+ # SentenceTransformer based on Qwen/Qwen3-Embedding-4B
185
+
186
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B). It maps sentences & paragraphs to a 2560-dimensional dense vector space and can be used for retrieval.
187
+
188
+ ## Model Details
189
+
190
+ ### Model Description
191
+ - **Model Type:** Sentence Transformer
192
+ - **Base model:** [Qwen/Qwen3-Embedding-4B](https://huggingface.co/Qwen/Qwen3-Embedding-4B) <!-- at revision 5cf2132abc99cad020ac570b19d031efec650f2b -->
193
+ - **Maximum Sequence Length:** 40960 tokens
194
+ - **Output Dimensionality:** 2560 dimensions
195
+ - **Similarity Function:** Cosine Similarity
196
+ - **Supported Modality:** Text
197
+ <!-- - **Training Dataset:** Unknown -->
198
+ <!-- - **Language:** Unknown -->
199
+ <!-- - **License:** Unknown -->
200
+
201
+ ### Model Sources
202
+
203
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
204
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/huggingface/sentence-transformers)
205
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
206
+
207
+ ### Full Model Architecture
208
+
209
+ ```
210
+ SentenceTransformer(
211
+ (0): Transformer({'transformer_task': 'feature-extraction', 'modality_config': {'text': {'method': 'forward', 'method_output_name': 'last_hidden_state'}}, 'module_output_name': 'token_embeddings', 'architecture': 'Qwen3Model'})
212
+ (1): Pooling({'embedding_dimension': 2560, 'pooling_mode': 'lasttoken', 'include_prompt': True})
213
+ (2): Normalize({})
214
+ )
215
+ ```
216
+
217
+ ## Usage
218
+
219
+ ### Direct Usage (Sentence Transformers)
220
+
221
+ First install the Sentence Transformers library:
222
+
223
+ ```bash
224
+ pip install -U sentence-transformers
225
+ ```
226
+ Then you can load this model and run inference.
227
+ ```python
228
+ from sentence_transformers import SentenceTransformer
229
+
230
+ # Download from the 🤗 Hub
231
+ model = SentenceTransformer("sentence_transformers_model_id")
232
+ # Run inference
233
+ queries = [
234
+ 'Bộ Tài chính quy định công ty xổ số điện toán phải kiểm tra, bảo dưỡng hệ thống xổ số điện toán bao nhiêu lần trong một năm?',
235
+ ]
236
+ documents = [
237
+ 'đ) Được công ty xổ số điện toán kiểm tra, bảo dưỡng định kỳ theo khuyến cáo của nhà sản xuất và quy định của công ty xổ số điện toán nhưng tối đa sáu (06) tháng một lần. 3. Hệ thống camera, màn hình để phục vụ cho việc giám sát quay số mở thưởng điện tử được bố trí ở những vị trí đảm bảo có thể giám sát quay số mở thưởng. Hình ảnh theo dõi qua camera được lưu giữ trong thời gian tối thiểu là sáu mươi (60) ngày, kể từ ngày quay số mở thưởng.',
238
+ 'Khoản 1. Cấp công trình quy định tại Thông tư này được xác định theo các tiêu chí sau: a) Mức ��ộ quan trọng, quy mô công suất: Áp dụng cho từng công trình độc lập hoặc một tổ hợp các công trình hoặc một dây chuyền công nghệ gồm nhiều hạng mục thuộc dự án đầu tư xây dựng công trình theo các loại công trình quy định tại Phụ lục I Thông tư này; b) Quy mô kết cấu: Áp dụng cho từng công trình độc lập thuộc dự án đầu tư xây dựng công trình theo các loại kết cấu quy định tại Phụ lục II Thông tư này.',
239
+ 'Điều 10. Tổ chức kiểm tra việc phân hạng và công nhận hạng nhà chung cư 1. Cục Quản lý nhà và thị trường bất động sản tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan, đơn vị chức năng thuộc Bộ Xây dựng và các Bộ, ngành có liên quan tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên phạm vi cả nước. 2. Sở Xây dựng các tỉnh, thành phố trực thuộc trung ương tổ chức thực hiện kiểm tra hoặc chủ trì, phối hợp với các cơ quan chức năng tại địa phương tổ chức kiểm tra định kỳ hoặc đột xuất việc phân hạng và công nhận hạng nhà chung cư trên địa bàn.',
240
+ ]
241
+ query_embeddings = model.encode_query(queries)
242
+ document_embeddings = model.encode_document(documents)
243
+ print(query_embeddings.shape, document_embeddings.shape)
244
+ # [1, 2560] [3, 2560]
245
+
246
+ # Get the similarity scores for the embeddings
247
+ similarities = model.similarity(query_embeddings, document_embeddings)
248
+ print(similarities)
249
+ # tensor([[ 0.6850, -0.0339, 0.1120]])
250
+ ```
251
+ <!--
252
+ ### Direct Usage (Transformers)
253
+
254
+ <details><summary>Click to see the direct usage in Transformers</summary>
255
+
256
+ </details>
257
+ -->
258
+
259
+ <!--
260
+ ### Downstream Usage (Sentence Transformers)
261
+
262
+ You can finetune this model on your own dataset.
263
+
264
+ <details><summary>Click to expand</summary>
265
+
266
+ </details>
267
+ -->
268
+
269
+ <!--
270
+ ### Out-of-Scope Use
271
+
272
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
273
+ -->
274
+
275
+ <!--
276
+ ## Bias, Risks and Limitations
277
+
278
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
279
+ -->
280
+
281
+ <!--
282
+ ### Recommendations
283
+
284
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
285
+ -->
286
+
287
+ ## Training Details
288
+
289
+ ### Training Dataset
290
+
291
+ #### Unnamed Dataset
292
+
293
+ * Size: 507,152 training samples
294
+ * Columns: <code>anchor</code> and <code>positive</code>
295
+ * Approximate statistics based on the first 1000 samples:
296
+ | | anchor | positive |
297
+ |:--------|:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------|
298
+ | type | string | string |
299
+ | details | <ul><li>min: 43 characters</li><li>mean: 117.84 characters</li><li>max: 318 characters</li></ul> | <ul><li>min: 444 characters</li><li>mean: 790.51 characters</li><li>max: 1195 characters</li></ul> |
300
+ * Samples:
301
+ | anchor | positive |
302
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
303
+ | <code>Bộ Giao thông vận tải quy định các đơn vị kinh doanh vận tải nào phải lắp đặt thiết bị giám sát hành trình trên xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
304
+ | <code>Bộ Giao thông vận tải giải thích như thế nào về các từ ngữ như 'hệ thống thông tin' và 'dữ liệu' trong quy định về thiết bị giám sát hành trình?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát hành trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
305
+ | <code>Pháp luật quy định như thế nào về việc thu nhận, quản lý và khai thác dữ liệu từ thiết bị giám sát hành trình của xe ô tô?</code> | <code>Chương I. QUY ĐỊNH CHUNG Điều 1. Phạm vi điều chỉnh. Thông tư này quy định về cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô sau (sau đây gọi chung là thiết bị giám sát hành trình). Điều 2. Đối tượng áp dụng. Thông tư này áp dụng đối với các đơn vị kinh doanh vận tải, bến xe khách, bến xe hàng, các đơn vị cung cấp dịch vụ giám sát hành trình và các cơ quan, tổ chức, cá nhân có liên quan đến việc cung cấp, quản lý và sử dụng dữ liệu từ thiết bị giám sát hành trình của xe ô tô trong phạm vi toàn quốc. Điều 3. Giải thích từ ngữ. Trong Thông tư này, các từ ngữ dưới đây được hiểu như sau: 1. Hệ thống thông tin: là tập hợp các thiết bị phần cứng, phần mềm và đường truyền dùng để thu nhận, quản lý, khai thác dữ liệu từ thiết bị giám sát hành trình. 2. Dữ liệu: là tập hợp các thông tin có cấu trúc được truyền từ thiết bị giám sát h��nh trình về máy chủ dịch vụ và từ máy chủ dịch vụ truyền về Tổng cục Đường bộ Việt Nam.</code> |
306
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
307
+ ```json
308
+ {
309
+ "scale": 20.0,
310
+ "similarity_fct": "cos_sim",
311
+ "mini_batch_size": 16,
312
+ "gather_across_devices": false,
313
+ "directions": [
314
+ "query_to_doc"
315
+ ],
316
+ "partition_mode": "joint",
317
+ "hardness_mode": null,
318
+ "hardness_strength": 0.0
319
+ }
320
+ ```
321
+
322
+ ### Training Hyperparameters
323
+ #### Non-Default Hyperparameters
324
+
325
+ - `per_device_train_batch_size`: 1024
326
+ - `num_train_epochs`: 2
327
+ - `learning_rate`: 2e-05
328
+ - `lr_scheduler_type`: constant_with_warmup
329
+ - `warmup_steps`: 0.1
330
+ - `bf16`: True
331
+ - `dataloader_num_workers`: 8
332
+ - `dataloader_persistent_workers`: True
333
+ - `remove_unused_columns`: False
334
+ - `ddp_find_unused_parameters`: False
335
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
336
+ Query:
337
+ - `batch_sampler`: no_duplicates
338
+
339
+ #### All Hyperparameters
340
+ <details><summary>Click to expand</summary>
341
+
342
+ - `per_device_train_batch_size`: 1024
343
+ - `num_train_epochs`: 2
344
+ - `max_steps`: -1
345
+ - `learning_rate`: 2e-05
346
+ - `lr_scheduler_type`: constant_with_warmup
347
+ - `lr_scheduler_kwargs`: None
348
+ - `warmup_steps`: 0.1
349
+ - `optim`: adamw_torch_fused
350
+ - `optim_args`: None
351
+ - `weight_decay`: 0.0
352
+ - `adam_beta1`: 0.9
353
+ - `adam_beta2`: 0.999
354
+ - `adam_epsilon`: 1e-08
355
+ - `optim_target_modules`: None
356
+ - `gradient_accumulation_steps`: 1
357
+ - `average_tokens_across_devices`: True
358
+ - `max_grad_norm`: 1.0
359
+ - `label_smoothing_factor`: 0.0
360
+ - `bf16`: True
361
+ - `fp16`: False
362
+ - `bf16_full_eval`: False
363
+ - `fp16_full_eval`: False
364
+ - `tf32`: None
365
+ - `gradient_checkpointing`: False
366
+ - `gradient_checkpointing_kwargs`: None
367
+ - `torch_compile`: False
368
+ - `torch_compile_backend`: None
369
+ - `torch_compile_mode`: None
370
+ - `use_liger_kernel`: False
371
+ - `liger_kernel_config`: None
372
+ - `use_cache`: False
373
+ - `neftune_noise_alpha`: None
374
+ - `torch_empty_cache_steps`: None
375
+ - `auto_find_batch_size`: False
376
+ - `log_on_each_node`: True
377
+ - `logging_nan_inf_filter`: True
378
+ - `include_num_input_tokens_seen`: no
379
+ - `log_level`: passive
380
+ - `log_level_replica`: warning
381
+ - `disable_tqdm`: False
382
+ - `project`: huggingface
383
+ - `trackio_space_id`: trackio
384
+ - `per_device_eval_batch_size`: 8
385
+ - `prediction_loss_only`: True
386
+ - `eval_on_start`: False
387
+ - `eval_do_concat_batches`: True
388
+ - `eval_use_gather_object`: False
389
+ - `eval_accumulation_steps`: None
390
+ - `include_for_metrics`: []
391
+ - `batch_eval_metrics`: False
392
+ - `save_only_model`: False
393
+ - `save_on_each_node`: False
394
+ - `enable_jit_checkpoint`: False
395
+ - `push_to_hub`: False
396
+ - `hub_private_repo`: None
397
+ - `hub_model_id`: None
398
+ - `hub_strategy`: every_save
399
+ - `hub_always_push`: False
400
+ - `hub_revision`: None
401
+ - `load_best_model_at_end`: False
402
+ - `ignore_data_skip`: False
403
+ - `restore_callback_states_from_checkpoint`: False
404
+ - `full_determinism`: False
405
+ - `seed`: 42
406
+ - `data_seed`: None
407
+ - `use_cpu`: False
408
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
409
+ - `parallelism_config`: None
410
+ - `dataloader_drop_last`: True
411
+ - `dataloader_num_workers`: 8
412
+ - `dataloader_pin_memory`: True
413
+ - `dataloader_persistent_workers`: True
414
+ - `dataloader_prefetch_factor`: None
415
+ - `remove_unused_columns`: False
416
+ - `label_names`: None
417
+ - `train_sampling_strategy`: random
418
+ - `length_column_name`: length
419
+ - `ddp_find_unused_parameters`: False
420
+ - `ddp_bucket_cap_mb`: None
421
+ - `ddp_broadcast_buffers`: False
422
+ - `ddp_backend`: None
423
+ - `ddp_timeout`: 1800
424
+ - `fsdp`: []
425
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
426
+ - `deepspeed`: None
427
+ - `debug`: []
428
+ - `skip_memory_metrics`: True
429
+ - `do_predict`: False
430
+ - `resume_from_checkpoint`: None
431
+ - `warmup_ratio`: None
432
+ - `local_rank`: -1
433
+ - `prompts`: Instruct: Given a user query related to law, retrieve the most relevant legal passages that directly answer the question.
434
+ Query:
435
+ - `batch_sampler`: no_duplicates
436
+ - `multi_dataset_batch_sampler`: proportional
437
+ - `router_mapping`: {}
438
+ - `learning_rate_mapping`: {}
439
+
440
+ </details>
441
+
442
+ ### Training Logs
443
+ | Epoch | Step | Training Loss |
444
+ |:------:|:----:|:-------------:|
445
+ | 0.0813 | 10 | 0.3239 |
446
+ | 0.1626 | 20 | 0.3034 |
447
+ | 0.2439 | 30 | 0.2333 |
448
+ | 0.3252 | 40 | 0.1800 |
449
+ | 0.4065 | 50 | 0.1686 |
450
+ | 0.4878 | 60 | 0.1541 |
451
+ | 0.5691 | 70 | 0.1425 |
452
+ | 0.6504 | 80 | 0.1341 |
453
+ | 0.7317 | 90 | 0.1300 |
454
+ | 0.8130 | 100 | 0.1205 |
455
+ | 0.8943 | 110 | 0.1214 |
456
+ | 0.9756 | 120 | 0.1174 |
457
+ | 1.0569 | 130 | 0.1123 |
458
+ | 1.1382 | 140 | 0.1107 |
459
+ | 1.2195 | 150 | 0.1116 |
460
+ | 1.3008 | 160 | 0.1054 |
461
+ | 1.3821 | 170 | 0.1066 |
462
+ | 1.4634 | 180 | 0.1062 |
463
+ | 1.5447 | 190 | 0.1031 |
464
+ | 1.6260 | 200 | 0.1027 |
465
+ | 1.7073 | 210 | 0.1005 |
466
+ | 1.7886 | 220 | 0.0995 |
467
+ | 1.8699 | 230 | 0.1000 |
468
+ | 1.9512 | 240 | 0.0957 |
469
+
470
+
471
+ ### Training Time
472
+ - **Training**: 2.6 hours
473
+
474
+ ### Framework Versions
475
+ - Python: 3.10.20
476
+ - Sentence Transformers: 5.4.1
477
+ - Transformers: 5.5.4
478
+ - PyTorch: 2.9.1+cu130
479
+ - Accelerate: 1.13.0
480
+ - Datasets: 4.8.4
481
+ - Tokenizers: 0.22.2
482
+
483
+ ## Citation
484
+
485
+ ### BibTeX
486
+
487
+ #### Sentence Transformers
488
+ ```bibtex
489
+ @inproceedings{reimers-2019-sentence-bert,
490
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
491
+ author = "Reimers, Nils and Gurevych, Iryna",
492
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
493
+ month = "11",
494
+ year = "2019",
495
+ publisher = "Association for Computational Linguistics",
496
+ url = "https://arxiv.org/abs/1908.10084",
497
+ }
498
+ ```
499
+
500
+ #### CachedMultipleNegativesRankingLoss
501
+ ```bibtex
502
+ @misc{gao2021scaling,
503
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
504
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
505
+ year={2021},
506
+ eprint={2101.06983},
507
+ archivePrefix={arXiv},
508
+ primaryClass={cs.LG}
509
+ }
510
+ ```
511
+
512
+ <!--
513
+ ## Glossary
514
+
515
+ *Clearly define terms in order to be accessible across audiences.*
516
+ -->
517
+
518
+ <!--
519
+ ## Model Card Authors
520
+
521
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
522
+ -->
523
+
524
+ <!--
525
+ ## Model Card Contact
526
+
527
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
528
+ -->
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/adapter_config.json ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "alora_invocation_tokens": null,
3
+ "alpha_pattern": {},
4
+ "arrow_config": null,
5
+ "auto_mapping": null,
6
+ "base_model_name_or_path": "Qwen/Qwen3-Embedding-4B",
7
+ "bias": "none",
8
+ "corda_config": null,
9
+ "ensure_weight_tying": false,
10
+ "eva_config": null,
11
+ "exclude_modules": null,
12
+ "fan_in_fan_out": false,
13
+ "inference_mode": false,
14
+ "init_lora_weights": true,
15
+ "layer_replication": null,
16
+ "layers_pattern": null,
17
+ "layers_to_transform": null,
18
+ "loftq_config": {},
19
+ "lora_alpha": 32,
20
+ "lora_bias": false,
21
+ "lora_dropout": 0,
22
+ "lora_ga_config": null,
23
+ "megatron_config": null,
24
+ "megatron_core": "megatron.core",
25
+ "modules_to_save": null,
26
+ "peft_type": "LORA",
27
+ "peft_version": "0.19.1",
28
+ "qalora_group_size": 16,
29
+ "r": 32,
30
+ "rank_pattern": {},
31
+ "revision": null,
32
+ "target_modules": [
33
+ "q_proj",
34
+ "up_proj",
35
+ "o_proj",
36
+ "gate_proj",
37
+ "v_proj",
38
+ "down_proj",
39
+ "k_proj"
40
+ ],
41
+ "target_parameters": null,
42
+ "task_type": "FEATURE_EXTRACTION",
43
+ "trainable_token_indices": null,
44
+ "use_bdlora": null,
45
+ "use_dora": false,
46
+ "use_qalora": false,
47
+ "use_rslora": false
48
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/adapter_model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:13733c58c57f04db6ed5691fb01f55fdda32c048d8a01634494305df347106ba
3
+ size 132185368
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/chat_template.jinja ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {%- if tools %}
2
+ {{- '<|im_start|>system\n' }}
3
+ {%- if messages[0]['role'] == 'system' %}
4
+ {{- messages[0]['content'] }}
5
+ {%- else %}
6
+ {{- 'You are a helpful assistant.' }}
7
+ {%- endif %}
8
+ {{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
9
+ {%- for tool in tools %}
10
+ {{- "\n" }}
11
+ {{- tool | tojson }}
12
+ {%- endfor %}
13
+ {{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
14
+ {%- else %}
15
+ {%- if messages[0]['role'] == 'system' %}
16
+ {{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
17
+ {%- else %}
18
+ {{- '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n' }}
19
+ {%- endif %}
20
+ {%- endif %}
21
+ {%- for message in messages %}
22
+ {%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
23
+ {{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
24
+ {%- elif message.role == "assistant" %}
25
+ {{- '<|im_start|>' + message.role }}
26
+ {%- if message.content %}
27
+ {{- '\n' + message.content }}
28
+ {%- endif %}
29
+ {%- for tool_call in message.tool_calls %}
30
+ {%- if tool_call.function is defined %}
31
+ {%- set tool_call = tool_call.function %}
32
+ {%- endif %}
33
+ {{- '\n<tool_call>\n{"name": "' }}
34
+ {{- tool_call.name }}
35
+ {{- '", "arguments": ' }}
36
+ {{- tool_call.arguments | tojson }}
37
+ {{- '}\n</tool_call>' }}
38
+ {%- endfor %}
39
+ {{- '<|im_end|>\n' }}
40
+ {%- elif message.role == "tool" %}
41
+ {%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
42
+ {{- '<|im_start|>user' }}
43
+ {%- endif %}
44
+ {{- '\n<tool_response>\n' }}
45
+ {{- message.content }}
46
+ {{- '\n</tool_response>' }}
47
+ {%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
48
+ {{- '<|im_end|>\n' }}
49
+ {%- endif %}
50
+ {%- endif %}
51
+ {%- endfor %}
52
+ {%- if add_generation_prompt %}
53
+ {{- '<|im_start|>assistant\n' }}
54
+ {%- endif %}
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "pytorch": "2.9.1+cu130",
4
+ "sentence_transformers": "5.4.1",
5
+ "transformers": "5.5.4"
6
+ },
7
+ "default_prompt_name": null,
8
+ "model_type": "SentenceTransformer",
9
+ "prompts": {
10
+ "document": "",
11
+ "query": "Instruct: Given a web search query, retrieve relevant passages that answer the query\nQuery:"
12
+ },
13
+ "similarity_fn_name": "cosine"
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.base.modules.transformer.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
19
+ }
20
+ ]
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/optimizer.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0b88728fd6c9f380cce881713b82b87c1532cc5c440839c8c7d98f5fc55a2ff7
3
+ size 264674251
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_0.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6754f664f73efa70f79c00b99567d387234384820b8fe10b313e462de77b8495
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_1.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:db75971c39cd9a194e48b017859bc96478c7734213705d9213b5bb398c16cf54
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_2.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:606bca044465082465b0f44b2f8315a6df4e738e2a406d5b81b59cc5aadf2667
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/rng_state_3.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6dfefabd447bd433f4faeee2129889d982e2f2585380bd4ee0e3378aa632419a
3
+ size 15365
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/scheduler.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:733e03e032271d8b70f04e78b8ad8256bade2a13256566d8911bb5fea4df0aa4
3
+ size 1465
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/sentence_bert_config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "transformer_task": "feature-extraction",
3
+ "modality_config": {
4
+ "text": {
5
+ "method": "forward",
6
+ "method_output_name": "last_hidden_state"
7
+ }
8
+ },
9
+ "module_output_name": "token_embeddings"
10
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:57da8061b845087a819ca0dc7d5d0ce75a5ba7a597946911fbf12b3b461e5b6b
3
+ size 11423043
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": false,
3
+ "backend": "tokenizers",
4
+ "bos_token": null,
5
+ "clean_up_tokenization_spaces": false,
6
+ "eos_token": "<|im_end|>",
7
+ "errors": "replace",
8
+ "is_local": false,
9
+ "model_max_length": 40960,
10
+ "pad_token": "<|endoftext|>",
11
+ "split_special_tokens": false,
12
+ "tokenizer_class": "Qwen2Tokenizer",
13
+ "unk_token": null
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/trainer_state.json ADDED
@@ -0,0 +1,202 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_global_step": null,
3
+ "best_metric": null,
4
+ "best_model_checkpoint": null,
5
+ "epoch": 2.0,
6
+ "eval_steps": 500,
7
+ "global_step": 246,
8
+ "is_hyper_param_search": false,
9
+ "is_local_process_zero": true,
10
+ "is_world_process_zero": true,
11
+ "log_history": [
12
+ {
13
+ "epoch": 0.08130081300813008,
14
+ "grad_norm": 0.400390625,
15
+ "learning_rate": 7.2000000000000005e-06,
16
+ "loss": 0.3238831043243408,
17
+ "step": 10
18
+ },
19
+ {
20
+ "epoch": 0.16260162601626016,
21
+ "grad_norm": 0.29296875,
22
+ "learning_rate": 1.5200000000000002e-05,
23
+ "loss": 0.30339827537536623,
24
+ "step": 20
25
+ },
26
+ {
27
+ "epoch": 0.24390243902439024,
28
+ "grad_norm": 0.1435546875,
29
+ "learning_rate": 2e-05,
30
+ "loss": 0.2333136796951294,
31
+ "step": 30
32
+ },
33
+ {
34
+ "epoch": 0.3252032520325203,
35
+ "grad_norm": 0.09423828125,
36
+ "learning_rate": 2e-05,
37
+ "loss": 0.18001788854599,
38
+ "step": 40
39
+ },
40
+ {
41
+ "epoch": 0.4065040650406504,
42
+ "grad_norm": 0.08544921875,
43
+ "learning_rate": 2e-05,
44
+ "loss": 0.16857454776763917,
45
+ "step": 50
46
+ },
47
+ {
48
+ "epoch": 0.4878048780487805,
49
+ "grad_norm": 0.06494140625,
50
+ "learning_rate": 2e-05,
51
+ "loss": 0.15414767265319823,
52
+ "step": 60
53
+ },
54
+ {
55
+ "epoch": 0.5691056910569106,
56
+ "grad_norm": 0.0634765625,
57
+ "learning_rate": 2e-05,
58
+ "loss": 0.1425204634666443,
59
+ "step": 70
60
+ },
61
+ {
62
+ "epoch": 0.6504065040650406,
63
+ "grad_norm": 0.06396484375,
64
+ "learning_rate": 2e-05,
65
+ "loss": 0.13414767980575562,
66
+ "step": 80
67
+ },
68
+ {
69
+ "epoch": 0.7317073170731707,
70
+ "grad_norm": 0.060791015625,
71
+ "learning_rate": 2e-05,
72
+ "loss": 0.12999284267425537,
73
+ "step": 90
74
+ },
75
+ {
76
+ "epoch": 0.8130081300813008,
77
+ "grad_norm": 0.056396484375,
78
+ "learning_rate": 2e-05,
79
+ "loss": 0.12052559852600098,
80
+ "step": 100
81
+ },
82
+ {
83
+ "epoch": 0.8943089430894309,
84
+ "grad_norm": 0.056640625,
85
+ "learning_rate": 2e-05,
86
+ "loss": 0.12136286497116089,
87
+ "step": 110
88
+ },
89
+ {
90
+ "epoch": 0.975609756097561,
91
+ "grad_norm": 0.06005859375,
92
+ "learning_rate": 2e-05,
93
+ "loss": 0.11741914749145507,
94
+ "step": 120
95
+ },
96
+ {
97
+ "epoch": 1.056910569105691,
98
+ "grad_norm": 0.064453125,
99
+ "learning_rate": 2e-05,
100
+ "loss": 0.11225228309631348,
101
+ "step": 130
102
+ },
103
+ {
104
+ "epoch": 1.1382113821138211,
105
+ "grad_norm": 0.06640625,
106
+ "learning_rate": 2e-05,
107
+ "loss": 0.11072337627410889,
108
+ "step": 140
109
+ },
110
+ {
111
+ "epoch": 1.2195121951219512,
112
+ "grad_norm": 0.053955078125,
113
+ "learning_rate": 2e-05,
114
+ "loss": 0.1116340160369873,
115
+ "step": 150
116
+ },
117
+ {
118
+ "epoch": 1.3008130081300813,
119
+ "grad_norm": 0.054443359375,
120
+ "learning_rate": 2e-05,
121
+ "loss": 0.10543688535690307,
122
+ "step": 160
123
+ },
124
+ {
125
+ "epoch": 1.3821138211382114,
126
+ "grad_norm": 0.0634765625,
127
+ "learning_rate": 2e-05,
128
+ "loss": 0.10659735202789307,
129
+ "step": 170
130
+ },
131
+ {
132
+ "epoch": 1.4634146341463414,
133
+ "grad_norm": 0.057861328125,
134
+ "learning_rate": 2e-05,
135
+ "loss": 0.10619059801101685,
136
+ "step": 180
137
+ },
138
+ {
139
+ "epoch": 1.5447154471544715,
140
+ "grad_norm": 0.0595703125,
141
+ "learning_rate": 2e-05,
142
+ "loss": 0.10310289859771729,
143
+ "step": 190
144
+ },
145
+ {
146
+ "epoch": 1.6260162601626016,
147
+ "grad_norm": 0.056884765625,
148
+ "learning_rate": 2e-05,
149
+ "loss": 0.10268113613128663,
150
+ "step": 200
151
+ },
152
+ {
153
+ "epoch": 1.7073170731707317,
154
+ "grad_norm": 0.0634765625,
155
+ "learning_rate": 2e-05,
156
+ "loss": 0.10047686100006104,
157
+ "step": 210
158
+ },
159
+ {
160
+ "epoch": 1.7886178861788617,
161
+ "grad_norm": 0.058837890625,
162
+ "learning_rate": 2e-05,
163
+ "loss": 0.09947114586830139,
164
+ "step": 220
165
+ },
166
+ {
167
+ "epoch": 1.8699186991869918,
168
+ "grad_norm": 0.07080078125,
169
+ "learning_rate": 2e-05,
170
+ "loss": 0.09997528195381164,
171
+ "step": 230
172
+ },
173
+ {
174
+ "epoch": 1.951219512195122,
175
+ "grad_norm": 0.060302734375,
176
+ "learning_rate": 2e-05,
177
+ "loss": 0.09566186666488648,
178
+ "step": 240
179
+ }
180
+ ],
181
+ "logging_steps": 10,
182
+ "max_steps": 246,
183
+ "num_input_tokens_seen": 0,
184
+ "num_train_epochs": 2,
185
+ "save_steps": 500,
186
+ "stateful_callbacks": {
187
+ "TrainerControl": {
188
+ "args": {
189
+ "should_epoch_stop": false,
190
+ "should_evaluate": false,
191
+ "should_log": false,
192
+ "should_save": true,
193
+ "should_training_stop": true
194
+ },
195
+ "attributes": {}
196
+ }
197
+ },
198
+ "total_flos": 0.0,
199
+ "train_batch_size": 1024,
200
+ "trial_name": null,
201
+ "trial_params": null
202
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/checkpoint-246/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9075a2b1e72c2618e63ed5cd6f52b9860b8916fa429eb31e18615fa7b48b5370
3
+ size 5713
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/config.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "architectures": [
3
+ "Qwen3ForCausalLM"
4
+ ],
5
+ "attention_bias": false,
6
+ "attention_dropout": 0.0,
7
+ "bos_token_id": 151643,
8
+ "eos_token_id": 151645,
9
+ "head_dim": 128,
10
+ "hidden_act": "silu",
11
+ "hidden_size": 2560,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 9728,
14
+ "max_position_embeddings": 40960,
15
+ "max_window_layers": 36,
16
+ "model_type": "qwen3",
17
+ "num_attention_heads": 32,
18
+ "num_hidden_layers": 36,
19
+ "num_key_value_heads": 8,
20
+ "rms_norm_eps": 1e-06,
21
+ "rope_scaling": null,
22
+ "rope_theta": 1000000,
23
+ "sliding_window": null,
24
+ "tie_word_embeddings": true,
25
+ "torch_dtype": "bfloat16",
26
+ "transformers_version": "4.51.2",
27
+ "use_cache": true,
28
+ "use_sliding_window": false,
29
+ "vocab_size": 151665
30
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/config_sentence_transformers.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "pytorch": "2.9.1+cu130",
4
+ "sentence_transformers": "5.4.1",
5
+ "transformers": "5.5.4"
6
+ },
7
+ "default_prompt_name": null,
8
+ "model_type": "SentenceTransformer",
9
+ "prompts": {
10
+ "document": "",
11
+ "query": "Instruct: Given a web search query, retrieve relevant passages that answer the query\nQuery:"
12
+ },
13
+ "similarity_fn_name": "cosine"
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.base.modules.transformer.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.sentence_transformer.modules.pooling.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.sentence_transformer.modules.normalize.Normalize"
19
+ }
20
+ ]
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/sentence_bert_config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "transformer_task": "feature-extraction",
3
+ "modality_config": {
4
+ "text": {
5
+ "method": "forward",
6
+ "method_output_name": "last_hidden_state"
7
+ }
8
+ },
9
+ "module_output_name": "token_embeddings"
10
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:57da8061b845087a819ca0dc7d5d0ce75a5ba7a597946911fbf12b3b461e5b6b
3
+ size 11423043
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/tokenizer_config.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "add_prefix_space": false,
3
+ "backend": "tokenizers",
4
+ "bos_token": null,
5
+ "clean_up_tokenization_spaces": false,
6
+ "eos_token": "<|im_end|>",
7
+ "errors": "replace",
8
+ "is_local": false,
9
+ "model_max_length": 40960,
10
+ "pad_token": "<|endoftext|>",
11
+ "split_special_tokens": false,
12
+ "tokenizer_class": "Qwen2Tokenizer",
13
+ "unk_token": null
14
+ }
Qwen3-Embedding-4B-peft-vilegal-stage1-adapter/training_args.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:9075a2b1e72c2618e63ed5cd6f52b9860b8916fa429eb31e18615fa7b48b5370
3
+ size 5713