Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 12
This is a sentence-transformers model finetuned from BAAI/bge-m3 on the json dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("vserifsaglam/bge-m3-law-v2")
# Run inference
sentences = [
'KARAR SONUCU :\n Açıklanan nedenlerle;\n1. Tarafların temyiz isteminin KABULÜNE,\n2. Davanın kısmen kabulü kısmen reddine ilişkin ... İdare Mahkemesi kararına yönelik olarak yapılan istinaf başvurularının reddi yolundaki temyize konu ... Bölge İdare Mahkemesi... İdari Dava Dairesinin... tarih ve E:..., K:... sayılı kararının BOZULMASINA,\n3. Yeniden bir karar verilmek üzere dosyanın ... Bölge İdare Mahkemesi ... İdari Dava Dairesine gönderilmesine, 27/11/2024 tarihinde oy birliğiyle kesin olarak karar verildi.',
'KARAR SONUCU:\n Açıklanan nedenlerle;\n1. Davalı idarenin temyiz isteminin KABULÜNE, davacının temyiz isteminin kısmen KABULÜNE, kısmen REDDİNE,\n2. Temyize konu ... Bölge İdare Mahkemesi ...İdari Dava Dairesinin... tarih ve E:..., K:... sayılı kararının; davanın kısmen incelenmeksizin reddine ilişkin ... İdare Mahkemesi kararına yönelik olarak yapılan istinaf başvurusunun reddi yolundaki kısmının ONANMASINA, davanın kısmen reddine ilişkin ... İdare Mahkemesi kararına yönelik olarak yapılan istinaf başvurusunun kısmen kabulü, kısmen reddi yolundaki kısımlarının BOZULMASINA,\n3. Bozulan kısımlar hakkında yeniden bir karar verilmek üzere dosyanın ... Bölge İdare Mahkemesi .... İdari Dava Dairesine gönderilmesine, 27/11/2024 tarihinde oy birliğiyle kesin olarak karar verildi.',
'd) Gerekli\nhallerde Merkezin faaliyetleri ile ilgili çalışma birimleri oluşturmak ve\nbunların görevlerini düzenlemek.\n\ne) Yerleşke\nbünyesindeki Merkezin yaşlı ve engelliler için eğitim ve bakım hizmetlerinin\nsağlanmasına yönelik projelerin düzenlenerek uygulanmasını sağlamak.\n\n**Danışma\nKurulu ve görevleri**\n\n**MADDE 12 –**\n(1) Danışma Kurulu; Üniversitede görevli konuyla ilgili öğretim elemanları ve\nistekleri halinde Merkezin çalışma alanlarına katkıda bulunabilecek kamu kurum\nve kuruluşları veya diğer kurum ve kuruluşların temsilcileri ile yaşlılar ve\nengelliler konusunda çalışmaları olan kişiler arasından Müdürün önerisi\nüzerine, Rektör tarafından üç yıl için görevlendirilen uzmanlardan oluşur.\nSüresi dolmadan görevlerinden ayrılan üyelerin yerine, kalan süreyi doldurmak\niçin aynı usulle yeni üyeler görevlendirilir. Süresi biten üyeler tekrar\ngörevlendirilebilir.\n\n(2) Danışma\nKurulu, Müdürün çağrısı üzerine yılda en az iki kez toplanır.\n\n(3) Danışma\nKurulu; Merkezin projelerine özel uzmanlık alanlarında katkı sağlar ve Merkez\nfaaliyetleriyle ilgili değerlendirmede bulunur.\n\n**Çalışma\nbirimleri**\n\n**MADDE 13 –**\n(1) Çalışma birimleri; bir başkan ve çalışma biriminin faaliyet alanıyla ilgili\nihtiyaç duyulan sayıda uzmandan oluşur. Çalışma birimi başkanları,\nÜniversitenin ilgili alanında çalışmalarıyla tanınan veya bu alanda çalışmak\nisteyen öğretim elemanları ile konuyla ilgili uzmanlar arasından Müdürün\nteklifiyle Yönetim Kurulu tarafından seçilir. Çalışma birimlerinin faaliyet\nalanlarıyla ilgili görevlendirilecek uzmanlar ise çalışma birimi başkanları\ntarafından belirlenir. Çalışma birimleri yaşlılık, engellilik, eğitim, sosyal\nve duygusal destek, psikolojik danışma, aile danışmanlığı, program geliştirme,\nmeslekî danışmanlık, bakım hizmetleri ve uygulama, proje geliştirme gibi\nbirimlerden oluşur.\n\n(2) Çalışma\nbirimlerinin görev ve sorumlulukları Yönetim Kurulu tarafından belirlenir ve\nuygulamaya konur.\n\n**DÖRDÜNCÜ BÖLÜM**\n\n**Çeşitli ve Son Hükümler**\n\n**Personel ihtiyacı**\n\n**MADDE 14 –**\n(1) Merkezin akademik, teknik ve idarî personel ihtiyacı, 2547 sayılı Kanunun\n13 üncü maddesine göre Müdürün önerisiyle Rektör tarafından görevlendirilecek\npersonel ile karşılanır.\n\n**Yönetmelikte\nhüküm bulunmayan haller**\n\n**MADDE 15 –**\n(1) Bu Yönetmelikte hüküm bulunmayan hallerde ilgili diğer mevzuat hükümleri\nile Senato ve Yönetim Kurulu kararları uygulanır.\n\n**Yürürlük**\n\n**MADDE 16 –**\n(1) Bu Yönetmelik yayımı tarihinde yürürlüğe girer.\n\n**Yürütme**\n\n**MADDE 17 –**\n(1) Bu Yönetmelik hükümlerini Necmettin Erbakan Üniversitesi Rektörü yürütür.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, 0.9693, -0.0835],
# [ 0.9693, 1.0000, -0.0746],
# [-0.0835, -0.0746, 1.0000]])
anchor, positive, and negative| anchor | positive | negative | |
|---|---|---|---|
| type | string | string | string |
| details |
|
|
|
| anchor | positive | negative |
|---|---|---|
HUKUKİ DEĞERLENDİRME |
|
2. Ceza Dairesi 2022/240 E. , 2025/3158 K. |
HUKUKİ DEĞERLENDİRME |
KARŞI OY : |
3 Haziran 2025 SALI Resmi Gazete Say! : 32919 |
HUKUKİ DEĞERLENDİRME |
HUKUKİ DEĞERLENDİRME |
Dosyanın incelenmesinden; davacı adına tescilli beyannameler muhteviyatı ... GTİP’li “cilalanmış granit” ticari isimli eşyanın 21/04/2020 tarih ve 31106 sayılı Resmi Gazete’de yayımlanmak suretiyle yürürlüğe giren 2430 İthalat Rejimi Kararına Ek Karar uyarınca ilave gümrük vergisine tabi olduğundan bahisle ihtirazi kayıt koyulmak suretiyle ödenen ilave gümrük, katma değer ve damga vergilerine 12/06/2020 tarihli dilekçe ile davalı idarede vekaleti bulunan yetkili gümrük müşavirince itiraz edildiği, itirazı inceleyen Bölge Müdürlüğünce verilen dava konusu kararın yine aynı yetkili gümrük müşavirine 29/07/2020 tarihinde tebliğ edildiği anlaşılmaktadır. Bilahare davacı vekilince 21/09/2020 tarihinde davalı idareye başvurularak ihtirazi kayıt koyulmak suretiyle ödenen ilave gümrük, katma değer ve damga vergilerine 12/06/2020 tarihli dilekçe ile yapmış oldukları itirazlarının neticesinin sorulduğu, davalı idarenin 07/10/2020 tarihinde davacı vekiline tebliğ edilen cevap üzerine 09/10/2020 ta... |
TripletLoss with these parameters:{
"distance_metric": "TripletDistanceMetric.COSINE",
"triplet_margin": 0.25
}
per_device_train_batch_size: 128learning_rate: 2e-05num_train_epochs: 2.0warmup_ratio: 0.1bf16: Truedataloader_num_workers: 8gradient_checkpointing: Trueoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 128per_device_eval_batch_size: 8per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 2.0max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Truefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 8dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Truegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss |
|---|---|---|
| 0.0515 | 100 | 0.0003 |
| 0.1030 | 200 | 0.0 |
| 0.1545 | 300 | 0.0 |
| 0.2060 | 400 | 0.0 |
| 0.2575 | 500 | 0.0 |
| 0.3090 | 600 | 0.0 |
| 0.3605 | 700 | 0.0 |
| 0.4119 | 800 | 0.0 |
| 0.4634 | 900 | 0.0 |
| 0.5149 | 1000 | 0.0 |
| 0.5664 | 1100 | 0.0 |
| 0.6179 | 1200 | 0.0 |
| 0.6694 | 1300 | 0.0 |
| 0.7209 | 1400 | 0.0 |
| 0.7724 | 1500 | 0.0 |
| 0.8239 | 1600 | 0.0 |
| 0.8754 | 1700 | 0.0 |
| 0.9269 | 1800 | 0.0 |
| 0.9784 | 1900 | 0.0 |
| 1.0299 | 2000 | 0.0 |
| 1.0814 | 2100 | 0.0 |
| 1.1329 | 2200 | 0.0 |
| 1.1843 | 2300 | 0.0 |
| 1.2358 | 2400 | 0.0 |
| 1.2873 | 2500 | 0.0 |
| 1.3388 | 2600 | 0.0 |
| 1.3903 | 2700 | 0.0 |
| 1.4418 | 2800 | 0.0 |
| 1.4933 | 2900 | 0.0 |
| 1.5448 | 3000 | 0.0 |
| 1.5963 | 3100 | 0.0 |
| 1.6478 | 3200 | 0.0 |
| 1.6993 | 3300 | 0.0 |
| 1.7508 | 3400 | 0.0 |
| 1.8023 | 3500 | 0.0 |
| 1.8538 | 3600 | 0.0 |
| 1.9053 | 3700 | 0.0 |
| 1.9567 | 3800 | 0.0 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{hermans2017defense,
title={In Defense of the Triplet Loss for Person Re-Identification},
author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
year={2017},
eprint={1703.07737},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
Base model
BAAI/bge-m3