Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
12
This model was finetuned with Unsloth.
based on unsloth/embeddinggemma-300m
This is a sentence-transformers model finetuned from unsloth/embeddinggemma-300m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 1024, 'do_lower_case': False, 'architecture': 'PeftModelForFeatureExtraction'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(4): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
queries = [
"Mau tes buta warna, bisa ke dr. Devi Azri Wahyuni di Siloam Sriwijaya Palembang?",
]
documents = [
'Berikut informasi profil dokter dr. Devi Azri Wahyuni, SpM (K) dengan spesialisasi Oftalmologi (Mata): Sub-spesialisasi: Subspesialis Neurooftalmologi, Rumah Sakit: Siloam Sriwijaya Palembang, Treatment: Pemeriksaan Mata, Pemeriksaan Slit Lamp, Tes Visus Mata, Pemeriksaan Lapang Pandang, Tonometri, Tes Buta Warna, Gejala/Penyakit: Neuritis Optik, Papilledema, Penyakit Graves, Penyakit Tiroid Mata, Buta Warna, Neuropati Diabetik, Penyakit Mata dan Masalah Penglihatan, Pendidikan: Universitas Respati Indonesia, Kolegium Oftalmologi Indonesia, Universitas Gadjah Mada, Universitas Sriwijaya, Universitas Sriwijaya',
'Berikut informasi profil dokter Adventia Emilia Krysna Sipi Seda, M.M., M.Psi., Psikolog dengan spesialisasi Psikologi: Sub-spesialisasi: Psikolog, Rumah Sakit: Siloam Hospitals Yogyakarta, Treatment: Manajemen Stres dan Kesehatan Emosional, Gejala/Penyakit: Gangguan Kecemasan, Pendidikan: Universitas Katolik Atma Jaya, Universitas Sanata Dharma',
'Apa itu Arteriosklerosis? Perbedaan Arteriosklerosis dan Aterosklerosis Penyebab Arteriosklerosis Gejala Arteriosklerosis Diagnosis Arteriosklerosis Pengobatan Arteriosklerosis Komplikasi Arteriosklerosis Pencegahan Arteriosklerosis Arteriosklerosis adalah kondisi medis yang terjadi ketika pembuluh darah arteri mengeras, menebal, dan kehilangan elastisitas karena adanya penumpukan plak lemak pada dinding pembuluh darah. Kondisi ini perlu diwaspadai karena dapat menghambat aliran darah menuju ber',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 768] [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.4944, 0.0387, 0.0981]], dtype=torch.float16)
InformationRetrievalEvaluator| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.8093 |
| cosine_accuracy@3 | 0.9144 |
| cosine_accuracy@5 | 0.9404 |
| cosine_accuracy@10 | 0.9599 |
| cosine_precision@1 | 0.8093 |
| cosine_precision@3 | 0.3048 |
| cosine_precision@5 | 0.1881 |
| cosine_precision@10 | 0.096 |
| cosine_recall@1 | 0.8093 |
| cosine_recall@3 | 0.9144 |
| cosine_recall@5 | 0.9404 |
| cosine_recall@10 | 0.9599 |
| cosine_ndcg@10 | 0.888 |
| cosine_mrr@10 | 0.8645 |
| cosine_map@100 | 0.8662 |
InformationRetrievalEvaluator| Metric | Value |
|---|---|
| cosine_accuracy@1 | 0.7996 |
| cosine_accuracy@3 | 0.9122 |
| cosine_accuracy@5 | 0.9361 |
| cosine_accuracy@10 | 0.9621 |
| cosine_precision@1 | 0.7996 |
| cosine_precision@3 | 0.3041 |
| cosine_precision@5 | 0.1872 |
| cosine_precision@10 | 0.0962 |
| cosine_recall@1 | 0.7996 |
| cosine_recall@3 | 0.9122 |
| cosine_recall@5 | 0.9361 |
| cosine_recall@10 | 0.9621 |
| cosine_ndcg@10 | 0.8843 |
| cosine_mrr@10 | 0.859 |
| cosine_map@100 | 0.8605 |
question and passage_text| question | passage_text | |
|---|---|---|
| type | string | string |
| details |
|
|
| question | passage_text |
|---|---|
dr A. A. Ayu Nancy Karang itu spesialis apa? |
Berikut informasi profil dokter dr. A. A. Ayu Nancy Karang, SpTHT-KL dengan spesialisasi Otorinolaringologi (THTBKL): Sub-spesialisasi: Spesialis Telinga Hidung Tenggorok Bedah Kepala dan Leher, Rumah Sakit: Siloam Hospitals Denpasar, Treatment: Irigasi Nasal, Nasal Endoskopi, Esofagektomi, Tiroidektomi, Gejala/Penyakit: Radang Amandel, Sinusitis, Vertigo, Suara Serak, Rhinitis, Kanker Laring, Polip Hidung, Otitis Media Akut, Pendidikan: Universitas Udayana, Universitas Udayana |
dr. Karina Anindita Sp.PD itu dokter penyakit dalam di Siloam Mataram ya? bisa obatin diabetes? |
Berikut informasi profil dokter dr. Karina Anindita, M.Biomed, Sp.PD dengan spesialisasi Penyakit Dalam: Sub-spesialisasi: Spesialis Penyakit Dalam, Rumah Sakit: Siloam Hospitals Mataram, Treatment: Ultrasonografi USG, Computed Tomography CT Scan, Elektrokardiogram EKG, Gejala/Penyakit: Gastritis, Infeksi Saluran Pencernaan, Hipertensi, Hiperkolesterolemia, Diabetes Melitus Tipe 2, Penyakit Autoimun, Asam Urat, Infeksi Saluran Kemih ISK, Infeksi Virus, Pendidikan: Universitas Udayana, Universitas Katolik Atma Jaya |
isk sama mens itu ada hubungannya ga sih? trus biar ga kena isk pas mens gimana? |
Apakah Infeksi Saluran Kemih Bisa Menghambat Menstruasi? Apakah Antibiotik Memengaruhi Siklus Menstruasi? Apakah Menstruasi Bisa Meningkatkan Risiko Infeksi Saluran Kemih? Cara Mengurangi Risiko Infeksi Saluran Kemih saat Menstruasi Infeksi saluran kemih (ISK) dikenal sebagai salah satu masalah kesehatan yang cukup umum terjadi, terutama pada wanita. Kondisi ini ditandai dengan adanya gejala seperti nyeri saat buang air kecil, sering buang air kecil, hingga rasa tidak nyaman di bagian perut bawa |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
question and passage_text| question | passage_text | |
|---|---|---|
| type | string | string |
| details |
|
|
| question | passage_text |
|---|---|
gerd bisa gara2 stres ga sih? |
GERD karena Stres, Bisakah Terjadi? Pengaruh Stres Terhadap Sistem Pencernaan Cara Mengatasi GERD Karena Stres Lambung merupakan organ pencernaan yang memiliki lingkungan relatif asam dengan tingkat keasaman (pH) kurang dari 4.0. Produksi asam lambung memiliki peran penting dalam pencernaan dan pemecahan komponen nutrisi yang dapat diserap oleh tubuh, seperti karbohidrat, asam amino, dan lemak. Ketika mengalami GERD, isi lambung dapat naik kembali ke kerongkongan sehingga menyebabkan gejala yang |
Sosmed itu ngaruh gak sih ke mental remaja? Ada tips biar gak kecanduan? |
Pengaruh Media Sosial terhadap Kesehatan Mental Remaja A. Dampak Positif Media Sosial B. Dampak Negatif Media Sosial Tips Mencegah Kecanduan Sosial Media pada Remaja Penggunaan media sosial telah menjadi bagian tak terpisahkan dari kehidupan remaja. Namun, di balik keterhubungannya yang luas, terdapat dampak yang signifikan terhadap kesehatan mental mereka. Bila tidak menggunakannya secara bijak, media sosial dapat meningkatkan risiko cemas dan rendah diri. Mari simak ulasan selengkapnya tentang |
bundle branch block itu apa ya? |
Apa itu Bundle Branch Block? Penyebab Bundle Branch Block Penyebab Right Bundle Branch Block Penyebab Left Bundle Branch Block Gejala Bundle Branch Block Diagnosis Bundle Branch Block Pengobatan Bundle Branch Block Bundle branch block (BBB) adalah salah satu gangguan pada impuls atau sinyal listrik yang bertugas untuk membuat bilik jantung (ventrikel) berkontraksi. Kondisi ini dapat menyebabkan detak jantung menjadi tidak teratur dan terkadang bisa menyulitkan kerja jantung dalam memompa darah k |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim",
"gather_across_devices": false
}
eval_strategy: stepsper_device_train_batch_size: 64per_device_eval_batch_size: 64gradient_accumulation_steps: 2learning_rate: 2e-05max_steps: 30warmup_ratio: 0.03prompts: {'question': '', 'passage_text': ''}batch_sampler: no_duplicatesoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 64per_device_eval_batch_size: 64per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 2eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 3.0max_steps: 30lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.03warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: {'question': '', 'passage_text': ''}batch_sampler: no_duplicatesmulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | Validation Loss | cosine_ndcg@10 |
|---|---|---|---|---|
| -1 | -1 | - | - | 0.0248 |
| 0.1923 | 5 | 3.2435 | 1.4189 | 0.5411 |
| 0.3846 | 10 | 1.0292 | 0.6577 | 0.7005 |
| 0.1923 | 5 | 0.529 | 0.4114 | 0.7501 |
| 0.3846 | 10 | 0.2951 | 0.3059 | 0.8290 |
| 0.5769 | 15 | 0.28 | 0.2372 | 0.8661 |
| 0.7692 | 20 | 0.242 | 0.2025 | 0.8796 |
| 0.9615 | 25 | 0.187 | 0.1807 | 0.8831 |
| 1.1538 | 30 | 0.1384 | 0.1731 | 0.8843 |
| -1 | -1 | - | - | 0.8880 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
unsloth/embeddinggemma-300m