Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
9
This is a sentence-transformers model finetuned from comet24082002/finetune_bge_simsce_V1. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("comet24082002/ft_bge_newLaw_MultipleNegativeRankingLoss_SimSCE_V1_5epochs")
# Run inference
sentences = [
'Đơn tố cáo nặc danh có được tiếp nhận xử lý không?',
'1. Trước khi thụ lý tố cáo, người giải quyết tố cáo tự mình hoặc giao cơ quan thanh tra nhà nước cùng cấp hoặc cơ quan, tổ chức, cá nhân khác xác minh thông tin về người tố cáo và điều kiện thụ lý tố cáo. Trường hợp người tố cáo không cư trú tại địa bàn quản lý hoặc gặp khó khăn trong việc xác minh thì người giải quyết tố cáo có thể ủy quyền cho cơ quan nhà nước ngang cấp hoặc cơ quan nhà nước cấp dưới xác minh thông tin cần thiết phục vụ việc ra quyết định thụ lý tố cáo. Việc thụ lý tố cáo được thực hiện theo quy định tại Điều 29 Luật Tố cáo. Quyết định thụ lý tố cáo được thực hiện theo Mẫu số 04 tại Phụ lục ban hành kèm theo Nghị định này.\n2. Trong thời hạn 05 ngày làm việc kể từ ngày ra quyết định thụ lý tố cáo, người giải quyết tố cáo có trách nhiệm thông báo cho người tố cáo và thông báo về nội dung tố cáo cho người bị tố cáo biết. Thông báo việc thụ lý tố cáo được thực hiện theo Mẫu số 05, thông báo về nội dung tố cáo cho người bị tố cáo thực hiện theo Mẫu số 06 tại Phụ lục ban hành kèm theo Nghị định này.',
'Chương trình, tài liệu đào tạo, bồi dưỡng\n...\n2. Chương trình, tài liệu bồi dưỡng:\na) Chương trình, tài liệu bồi dưỡng theo tiêu chuẩn ngạch công chức, thời gian thực hiện tối thiểu là 06 tuần, tối đa là 08 tuần, bao gồm:\n- Chương trình bồi dưỡng ngạch cán sự và tương đương;\n- Chương trình bồi dưỡng các ngạch: chuyên viên và tương đương; chuyên viên chính và tương đương; chuyên viên cao cấp và tương đương.\nb) Chương trình, tài liệu bồi dưỡng theo tiêu chuẩn chức vụ cán bộ lãnh đạo, quản lý, thời gian thực hiện tối thiểu là 02 tuần, tối đa là 04 tuần, bao gồm:\n- Chương trình bồi dưỡng lãnh đạo cấp phòng và tương đương;\n- Chương trình bồi dưỡng lãnh đạo VKSND cấp huyện và tương đương;\n- Chương trình bồi dưỡng lãnh đạo VKSND cấp tỉnh, lãnh đạo cấp vụ và tương đương.\nc) Chương trình, tài liệu bồi dưỡng theo yêu cầu của vị trí việc làm, kiến thức, kỹ năng chuyên ngành, thời gian thực hiện tối đa là 01 tuần.\nd) Đối với việc bồi dưỡng lãnh đạo VKSND tối cao và các chương trình bồi dưỡng khác (bao gồm bồi dưỡng viên chức) thực hiện theo quy định của Đảng và Nhà nước.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
anchor and positive| anchor | positive | |
|---|---|---|
| type | string | string |
| details |
|
|
| anchor | positive |
|---|---|
Phó trưởng phòng của một đơn vị sự nghiệp công lập có được bổ nhiệm làm kế toán trưởng tại đơn vị mình đang công tác không? |
“Điều 52. Những người không được làm kế toán |
Có được hưởng cùng lúc trợ cấp thất nghiệp và bảo hiểm thai sản không? |
“Điều 31. Điều kiện hưởng chế độ thai sản |
Viên chức cảng vụ hàng không phải đáp ứng những tiêu chuẩn nào? |
Cảng vụ viên hàng không hạng V - Mã số V.12.01.05 |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
per_device_train_batch_size: 4learning_rate: 2e-05num_train_epochs: 5warmup_ratio: 0.1overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 4per_device_eval_batch_size: 8per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 5max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Falsehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseeval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falsebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportional| Epoch | Step | Training Loss |
|---|---|---|
| 0.0190 | 50 | 0.123 |
| 0.0380 | 100 | 0.1534 |
| 0.0570 | 150 | 0.0364 |
| 0.0760 | 200 | 0.0487 |
| 0.0950 | 250 | 0.0341 |
| 0.1140 | 300 | 0.0303 |
| 0.1330 | 350 | 0.0091 |
| 0.1520 | 400 | 0.0194 |
| 0.1710 | 450 | 0.0113 |
| 0.1900 | 500 | 0.0252 |
| 0.2090 | 550 | 0.0138 |
| 0.2281 | 600 | 0.0155 |
| 0.2471 | 650 | 0.0274 |
| 0.2661 | 700 | 0.0324 |
| 0.2851 | 750 | 0.0071 |
| 0.3041 | 800 | 0.0135 |
| 0.3231 | 850 | 0.0274 |
| 0.3421 | 900 | 0.0067 |
| 0.3611 | 950 | 0.0095 |
| 0.3801 | 1000 | 0.0218 |
| 0.3991 | 1050 | 0.0292 |
| 0.4181 | 1100 | 0.0041 |
| 0.4371 | 1150 | 0.0072 |
| 0.4561 | 1200 | 0.0051 |
| 0.4751 | 1250 | 0.004 |
| 0.4941 | 1300 | 0.0043 |
| 0.5131 | 1350 | 0.0067 |
| 0.5321 | 1400 | 0.0089 |
| 0.5511 | 1450 | 0.0281 |
| 0.5701 | 1500 | 0.0186 |
| 0.5891 | 1550 | 0.0316 |
| 0.6081 | 1600 | 0.0046 |
| 0.6271 | 1650 | 0.0331 |
| 0.6461 | 1700 | 0.018 |
| 0.6651 | 1750 | 0.0097 |
| 0.6842 | 1800 | 0.0629 |
| 0.7032 | 1850 | 0.0388 |
| 0.7222 | 1900 | 0.0084 |
| 0.7412 | 1950 | 0.0312 |
| 0.7602 | 2000 | 0.0409 |
| 0.7792 | 2050 | 0.0236 |
| 0.7982 | 2100 | 0.0248 |
| 0.8172 | 2150 | 0.0287 |
| 0.8362 | 2200 | 0.0564 |
| 0.8552 | 2250 | 0.0381 |
| 0.8742 | 2300 | 0.013 |
| 0.8932 | 2350 | 0.0213 |
| 0.9122 | 2400 | 0.009 |
| 0.9312 | 2450 | 0.0105 |
| 0.9502 | 2500 | 0.0369 |
| 0.9692 | 2550 | 0.0545 |
| 0.9882 | 2600 | 0.0473 |
| 1.0072 | 2650 | 0.0475 |
| 1.0262 | 2700 | 0.0069 |
| 1.0452 | 2750 | 0.002 |
| 1.0642 | 2800 | 0.011 |
| 1.0832 | 2850 | 0.0061 |
| 1.1022 | 2900 | 0.009 |
| 1.1212 | 2950 | 0.007 |
| 1.1403 | 3000 | 0.006 |
| 1.1593 | 3050 | 0.0037 |
| 1.1783 | 3100 | 0.0185 |
| 1.1973 | 3150 | 0.0071 |
| 1.2163 | 3200 | 0.0049 |
| 1.2353 | 3250 | 0.0094 |
| 1.2543 | 3300 | 0.0079 |
| 1.2733 | 3350 | 0.0084 |
| 1.2923 | 3400 | 0.0053 |
| 1.3113 | 3450 | 0.0019 |
| 1.3303 | 3500 | 0.0259 |
| 1.3493 | 3550 | 0.0022 |
| 1.3683 | 3600 | 0.0131 |
| 1.3873 | 3650 | 0.0266 |
| 1.4063 | 3700 | 0.0321 |
| 1.4253 | 3750 | 0.0168 |
| 1.4443 | 3800 | 0.0498 |
| 1.4633 | 3850 | 0.0075 |
| 1.4823 | 3900 | 0.0026 |
| 1.5013 | 3950 | 0.001 |
| 1.5203 | 4000 | 0.0344 |
| 1.5393 | 4050 | 0.0081 |
| 1.5583 | 4100 | 0.0049 |
| 1.5773 | 4150 | 0.0102 |
| 1.5964 | 4200 | 0.0129 |
| 1.6154 | 4250 | 0.0061 |
| 1.6344 | 4300 | 0.0028 |
| 1.6534 | 4350 | 0.0134 |
| 1.6724 | 4400 | 0.0075 |
| 1.6914 | 4450 | 0.0229 |
| 1.7104 | 4500 | 0.0051 |
| 1.7294 | 4550 | 0.002 |
| 1.7484 | 4600 | 0.0054 |
| 1.7674 | 4650 | 0.0128 |
| 1.7864 | 4700 | 0.0022 |
| 1.8054 | 4750 | 0.0009 |
| 1.8244 | 4800 | 0.0102 |
| 1.8434 | 4850 | 0.0066 |
| 1.8624 | 4900 | 0.003 |
| 1.8814 | 4950 | 0.0031 |
| 1.9004 | 5000 | 0.0013 |
| 1.9194 | 5050 | 0.0029 |
| 1.9384 | 5100 | 0.0396 |
| 1.9574 | 5150 | 0.0054 |
| 1.9764 | 5200 | 0.0054 |
| 1.9954 | 5250 | 0.015 |
| 2.0144 | 5300 | 0.0045 |
| 2.0334 | 5350 | 0.0027 |
| 2.0525 | 5400 | 0.0037 |
| 2.0715 | 5450 | 0.0049 |
| 2.0905 | 5500 | 0.0016 |
| 2.1095 | 5550 | 0.0009 |
| 2.1285 | 5600 | 0.0012 |
| 2.1475 | 5650 | 0.002 |
| 2.1665 | 5700 | 0.0078 |
| 2.1855 | 5750 | 0.0255 |
| 2.2045 | 5800 | 0.0277 |
| 2.2235 | 5850 | 0.0012 |
| 2.2425 | 5900 | 0.0012 |
| 2.2615 | 5950 | 0.0014 |
| 2.2805 | 6000 | 0.0013 |
| 2.2995 | 6050 | 0.0047 |
| 2.3185 | 6100 | 0.0013 |
| 2.3375 | 6150 | 0.0076 |
| 2.3565 | 6200 | 0.009 |
| 2.3755 | 6250 | 0.0007 |
| 2.3945 | 6300 | 0.0087 |
| 2.4135 | 6350 | 0.0002 |
| 2.4325 | 6400 | 0.0017 |
| 2.4515 | 6450 | 0.0106 |
| 2.4705 | 6500 | 0.0016 |
| 2.4895 | 6550 | 0.0011 |
| 2.5086 | 6600 | 0.0024 |
| 2.5276 | 6650 | 0.0092 |
| 2.5466 | 6700 | 0.0012 |
| 2.5656 | 6750 | 0.0143 |
| 2.5846 | 6800 | 0.0015 |
| 2.6036 | 6850 | 0.0008 |
| 2.6226 | 6900 | 0.0149 |
| 2.6416 | 6950 | 0.0058 |
| 2.6606 | 7000 | 0.0227 |
| 2.6796 | 7050 | 0.0004 |
| 2.6986 | 7100 | 0.0066 |
| 2.7176 | 7150 | 0.0059 |
| 2.7366 | 7200 | 0.0011 |
| 2.7556 | 7250 | 0.0323 |
| 2.7746 | 7300 | 0.0016 |
| 2.7936 | 7350 | 0.0023 |
| 2.8126 | 7400 | 0.0107 |
| 2.8316 | 7450 | 0.0015 |
| 2.8506 | 7500 | 0.0023 |
| 2.8696 | 7550 | 0.0058 |
| 2.8886 | 7600 | 0.0004 |
| 2.9076 | 7650 | 0.0103 |
| 2.9266 | 7700 | 0.0005 |
| 2.9456 | 7750 | 0.0013 |
| 2.9647 | 7800 | 0.0004 |
| 2.9837 | 7850 | 0.0018 |
| 3.0027 | 7900 | 0.0016 |
| 3.0217 | 7950 | 0.0034 |
| 3.0407 | 8000 | 0.0012 |
| 3.0597 | 8050 | 0.0046 |
| 3.0787 | 8100 | 0.001 |
| 3.0977 | 8150 | 0.0005 |
| 3.1167 | 8200 | 0.0037 |
| 3.1357 | 8250 | 0.0046 |
| 3.1547 | 8300 | 0.0013 |
| 3.1737 | 8350 | 0.0011 |
| 3.1927 | 8400 | 0.0107 |
| 3.2117 | 8450 | 0.0012 |
| 3.2307 | 8500 | 0.0025 |
| 3.2497 | 8550 | 0.0018 |
| 3.2687 | 8600 | 0.0005 |
| 3.2877 | 8650 | 0.0051 |
| 3.3067 | 8700 | 0.0006 |
| 3.3257 | 8750 | 0.0004 |
| 3.3447 | 8800 | 0.003 |
| 3.3637 | 8850 | 0.0055 |
| 3.3827 | 8900 | 0.015 |
| 3.4017 | 8950 | 0.016 |
| 3.4208 | 9000 | 0.0008 |
| 3.4398 | 9050 | 0.0006 |
| 3.4588 | 9100 | 0.0004 |
| 3.4778 | 9150 | 0.0008 |
| 3.4968 | 9200 | 0.0167 |
| 3.5158 | 9250 | 0.0004 |
| 3.5348 | 9300 | 0.0051 |
| 3.5538 | 9350 | 0.0093 |
| 3.5728 | 9400 | 0.0004 |
| 3.5918 | 9450 | 0.003 |
| 3.6108 | 9500 | 0.0005 |
| 3.6298 | 9550 | 0.0006 |
| 3.6488 | 9600 | 0.0073 |
| 3.6678 | 9650 | 0.0021 |
| 3.6868 | 9700 | 0.0019 |
| 3.7058 | 9750 | 0.0013 |
| 3.7248 | 9800 | 0.0005 |
| 3.7438 | 9850 | 0.0005 |
| 3.7628 | 9900 | 0.0011 |
| 3.7818 | 9950 | 0.0007 |
| 3.8008 | 10000 | 0.0081 |
| 3.8198 | 10050 | 0.0017 |
| 3.8388 | 10100 | 0.0154 |
| 3.8578 | 10150 | 0.0035 |
| 3.8769 | 10200 | 0.0023 |
| 3.8959 | 10250 | 0.0007 |
| 3.9149 | 10300 | 0.0143 |
| 3.9339 | 10350 | 0.0005 |
| 3.9529 | 10400 | 0.0002 |
| 3.9719 | 10450 | 0.0103 |
| 3.9909 | 10500 | 0.0019 |
| 4.0099 | 10550 | 0.0008 |
| 4.0289 | 10600 | 0.0066 |
| 4.0479 | 10650 | 0.0002 |
| 4.0669 | 10700 | 0.0067 |
| 4.0859 | 10750 | 0.0009 |
| 4.1049 | 10800 | 0.003 |
| 4.1239 | 10850 | 0.0001 |
| 4.1429 | 10900 | 0.0016 |
| 4.1619 | 10950 | 0.0005 |
| 4.1809 | 11000 | 0.0249 |
| 4.1999 | 11050 | 0.0379 |
| 4.2189 | 11100 | 0.0106 |
| 4.2379 | 11150 | 0.0015 |
| 4.2569 | 11200 | 0.0003 |
| 4.2759 | 11250 | 0.0004 |
| 4.2949 | 11300 | 0.0026 |
| 4.3139 | 11350 | 0.0003 |
| 4.3330 | 11400 | 0.0001 |
| 4.3520 | 11450 | 0.0002 |
| 4.3710 | 11500 | 0.0004 |
| 4.3900 | 11550 | 0.0003 |
| 4.4090 | 11600 | 0.0042 |
| 4.4280 | 11650 | 0.0037 |
| 4.4470 | 11700 | 0.0046 |
| 4.4660 | 11750 | 0.0013 |
| 4.4850 | 11800 | 0.0003 |
| 4.5040 | 11850 | 0.0003 |
| 4.5230 | 11900 | 0.0019 |
| 4.5420 | 11950 | 0.0002 |
| 4.5610 | 12000 | 0.0019 |
| 4.5800 | 12050 | 0.0003 |
| 4.5990 | 12100 | 0.0002 |
| 4.6180 | 12150 | 0.0009 |
| 4.6370 | 12200 | 0.0007 |
| 4.6560 | 12250 | 0.0051 |
| 4.6750 | 12300 | 0.0003 |
| 4.6940 | 12350 | 0.0031 |
| 4.7130 | 12400 | 0.0002 |
| 4.7320 | 12450 | 0.0018 |
| 4.7510 | 12500 | 0.0003 |
| 4.7700 | 12550 | 0.0004 |
| 4.7891 | 12600 | 0.0017 |
| 4.8081 | 12650 | 0.0042 |
| 4.8271 | 12700 | 0.0022 |
| 4.8461 | 12750 | 0.0082 |
| 4.8651 | 12800 | 0.0017 |
| 4.8841 | 12850 | 0.0042 |
| 4.9031 | 12900 | 0.0005 |
| 4.9221 | 12950 | 0.0002 |
| 4.9411 | 13000 | 0.0061 |
| 4.9601 | 13050 | 0.0011 |
| 4.9791 | 13100 | 0.0003 |
| 4.9981 | 13150 | 0.0016 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
comet24082002/finetune_bge_simsce_V1