Update README.md
Browse files
README.md
CHANGED
|
@@ -3,9 +3,26 @@ language: vi
|
|
| 3 |
datasets:
|
| 4 |
- NghiemAbe/doc2query
|
| 5 |
widget:
|
| 6 |
-
- text:
|
| 7 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 8 |
license: apache-2.0
|
|
|
|
|
|
|
| 9 |
---
|
| 10 |
|
| 11 |
# NghiemAbe/Law-Doc2Query
|
|
@@ -21,7 +38,7 @@ It can be used for:
|
|
| 21 |
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
|
| 22 |
import torch
|
| 23 |
|
| 24 |
-
model_name = 'NghiemAbe/
|
| 25 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
| 26 |
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
|
| 27 |
|
|
@@ -72,7 +89,4 @@ create_queries(text)
|
|
| 72 |
**Note:** `model.generate()` is non-deterministic for top_k/top_n sampling. It produces different queries each time you run it.
|
| 73 |
|
| 74 |
## Training
|
| 75 |
-
This model fine-tuned [doc2query/msmarco-vietnamese-mt5-base-v1](https://huggingface.co/doc2query/msmarco-vietnamese-mt5-base-v1/) for 4k training steps (4 epochs on the 2k5 training pairs from Legal).
|
| 76 |
-
|
| 77 |
-
|
| 78 |
-
|
|
|
|
| 3 |
datasets:
|
| 4 |
- NghiemAbe/doc2query
|
| 5 |
widget:
|
| 6 |
+
- text: >-
|
| 7 |
+
1. Bố trí lực lượng tham gia tuần tra, kiểm soát trật tự, an toàn giao thông
|
| 8 |
+
theo kế hoạch. 2. Thống kê, báo cáo các vụ, việc vi phạm pháp luật, tai nạn
|
| 9 |
+
giao thông đường bộ; kết quả tuần tra, kiểm soát và xử lý vi phạm hành chính
|
| 10 |
+
về trật tự, an toàn giao thông đường bộ theo sự phân công trong kế hoạch. 3.
|
| 11 |
+
Trường hợp không có lực lượng Cảnh sát giao thông đi cùng thì lực lượng Cảnh
|
| 12 |
+
sát khác và Công an xã thực hiện việc tuần tra, kiểm soát theo kế hoạch đã
|
| 13 |
+
được cấp có thẩm quyền phê duyệt. 4. Lực lượng Công an xã chỉ được tuần tra,
|
| 14 |
+
kiểm soát trên các tuyến đường liên xã, liên thôn thuộc địa bàn quản lý và
|
| 15 |
+
xử lý các hành vi vi phạm trật tự, an toàn giao thông sau: điều khiển xe mô
|
| 16 |
+
tô, xe gắn máy không đội mũ bảo hiểm, chở quá số người quy định, chở hàng
|
| 17 |
+
hóa cồng kềnh; đỗ xe ở lòng đường trái quy định; điều khiển phương tiện
|
| 18 |
+
phóng nhanh, lạng lách, đánh võng, tháo ống xả, không có gương chiếu hậu
|
| 19 |
+
hoặc chưa đủ tuổi điều khiển phương tiện theo quy định của pháp luật và các
|
| 20 |
+
hành vi vi phạm hành lang an toàn giao thông đường bộ như họp chợ dưới lòng
|
| 21 |
+
đường, lấn chiếm hành lang an toàn giao thông. Nghiêm cấm việc Công an xã
|
| 22 |
+
dừng xe, kiểm soát trên các tuyến quốc lộ, tỉnh lộ.
|
| 23 |
license: apache-2.0
|
| 24 |
+
tags:
|
| 25 |
+
- legal
|
| 26 |
---
|
| 27 |
|
| 28 |
# NghiemAbe/Law-Doc2Query
|
|
|
|
| 38 |
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
|
| 39 |
import torch
|
| 40 |
|
| 41 |
+
model_name = 'NghiemAbe/Law-Doc2Query'
|
| 42 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
| 43 |
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
|
| 44 |
|
|
|
|
| 89 |
**Note:** `model.generate()` is non-deterministic for top_k/top_n sampling. It produces different queries each time you run it.
|
| 90 |
|
| 91 |
## Training
|
| 92 |
+
This model fine-tuned [doc2query/msmarco-vietnamese-mt5-base-v1](https://huggingface.co/doc2query/msmarco-vietnamese-mt5-base-v1/) for 4k training steps (4 epochs on the 2k5 training pairs from Legal).
|
|
|
|
|
|
|
|
|