Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
12
This is a sentence-transformers model finetuned from google/embeddinggemma-300m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
(4): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Jwinz/cv-ats-scoring-model")
# Run inference
queries = [
"Deskripsi Pekerjaan\r\nDesign visual assets for Kompascom+ campaigns, including digital banners, posters, email marketing visuals, social media ads, and other promotional materials.\r\nEdit and develop video content for campaigns, both short-form and long-form, using editing tools such as CapCut, Premiere, or similar software.\r\nCollaborate closely with Growth Teams to translate campaign briefs into creative, engaging, and high-performing outputs.\r\nEstablish visual guidelines to ensure campaign materials remain consistent with Kompascom+ brand identity and messaging.\r\nCreate alternative creative variations for A/B Testing to optimize campaign performance and audience engagement.\r\nKualifikasi Minimum\r\nPossess a design and video editing portfolio that demonstrates creativity, technical skills, and a solid understanding of branding principles.\r\nFamiliarity with ad design requirements for platforms such as Facebook Ads, Google Ads, and TikTok Ads is a strong advantage.\r\nAble to work under tight deadlines, manage multiple design requests, and maintain high-quality output.\r\nProactive, detail-oriented, and open to constructive feedback for continuous improvement and creative iteration.\r\nRingkasan Perkerjaan\r\nTINGKAT POSISI\r\nMagang / OJT\r\nSPESIALISASI\r\nMedia and Creatives\r\nPERSYARATAN TINGKAT PENDIDIKAN\r\nLulus program Sarjana (S1)\r\nRESPON REKRUTER KE LAMARAN\r\nOnce in a while\r\nALAMAT KANTOR\r\nJalan Palmerah Selatan, Gelora Kel., Tanah Abang, Jakarta Pusat, 10270, Indonesia\r\nINDUSTRI\r\nMedia Production\r\nLOWONGAN\r\n1 lowongan dibuka\r\nSITUS\r\nhttp://www.kompasgramedia.com",
]
documents = [
'@\nADITYA AJISAKTI adityaajisakti95@gmail.com\nO\n081333716233\n,\nBlurukidul, Kab. Sidoarjo\nOBJECTIVE\nPengalaman kerja saya sebagai seorang pekerja Logistik, membuat saya terbiasa dengan pekerjaan yang dinamis. Hal tersebut\nmenjadikan saya pribadi yang selalu berplanning, strategis, dan efisien dalam setiap pengambilan keputusan.\nEXPERIENCE\nPT. Supra Primatama Nusantara (Biznet) Okt 2020 - Present\nStaff Logistics\nMampu menghasilkan tingkat akurasi inventory gudang sebesar 100% sesuai dengan sistem.\nMampu mengelola Material Requirements Planning dengan tingkat akurasi forcasting sebesar 85%.\nMampu meningkatkan efisiensi pengiriman barang dengan memperhatikan kubikasi barang, Tonase barang dan\nkarakteristik Armada yang digunakan.\nMampu berkomunikasi antar divisi untuk meningkatkan kualitas inventory gudang.\nMengelola kinerja tim agar mampu bekerja dengan efisien dan sesuai SOP.\nMengelola weekly report dan task pekerjaan tim.\nAPP Sinarmas (PT. Purinusa Eka Persada) Sep 2018 - Sep 2020\nOfficer Logistic (Leader Shift)\nGraduate Trainee Program (6 bulan)\nShift Leader\nMampu menghasilkan distribusi finish good sebanyak 80 ton per hari.\nMampu menganalisa stock gudang dengan persentase sebesar 80% matrial ready to pick.\nMemberikan penawaran jadwal pengiriman kepada marketing dengan memperhatikan efisiensi dan target yang dicapai.\nMampu meningkatkan efisiensi pengiriman barang dengan memperhatikan kubikasi barang, Tonase barang dan\nkarakteristik Armada yang digunakan.\nMengelola kinerja tim agar mampu bekerja dengan efisien dan sesuai SOP.\nMengelola daily report dan serah terima pergantian shift.\nEDUCATION\nInstitut Teknologi Nasional Malang 2017\nS1 Teknik Elektro\n3.49\nSKILLS\nTransportation Management Shipment Planning SAP Excel Leadership Warehouse Management\nCERTIFICATIONS\nTelkomsel Apprentice Program\nInternship program from Telkomsel\nWarehouse Management\nOnline Training by Prodemy (productivity academy)',
'DEWI ANGGRAENI\nMalang, Jawa Timur | 089680214352| anggraenidewi156@gmail.com\nRINGKASAN\nNama saya Dewi Anggraeni. Saya lahir di Malang, 26 Oktober 1998. Saya lulusan S1\nPendidikan Akuntansi Universitas Negeri Malang. Saya tertarik dalam bidang Administrasi.\nSaya berpengalaman di bidang administrasi dalam kegiatan organisasi dan program kampus\nmerdeka. Terlatih untuk bekerja langsung di lapangan secara tim maupun individu.\nPENGALAMAN ORGANISASI\nUKPSM Swara Satata Çakti UM\nAnggota (Oktober 2019 - saat ini)\n• Aktif dalam mengikuti kegiatan yang diadakan dalam maupun luar organisasi\nSie Sekretariat dan Administrasi Kompetisi Vokal Solo Nasional Swara Satata Çakti (2020)\n• Membuat rekapan data peserta lomba\n• Merapikan data peserta lomba sesuai dengan kategori lomba\n• Membuat sertifikat untuk panitia dan peserta lomba\nPENGALAMAN MAGANG\nKajian dan Praktik Lapangan di SMK Muhammadiyah 3 Singosari\nGuru Akuntansi (Agustus 2021 – September 2021)\n• Mengajar akuntansi dengan 6 Kompetensi Dasar untuk siswa kelas XII\n• Mengkoordinasikan siswa dalam kegiatan sekolah, seperti kegiatan vaksin dan kewirausahaan\n• Membuat rekapan data kegiatan siswa, seperti kegiatan shalat berjamaah dan kajian keputrian\nsiswa\nProgram Kampus Merdeka di SMK Muhammadiyah 3 Singosari\nGuru Asistensi Mengajar (September 2021 – November 2021)\n• Membantu proses administrasi pengambilan serta cap 3 jari ijazah alumni\n• Membuat rekapan data penjajakan dan pengambilan ijazah siswa\n• Membantu proses administrasi peminjaman dan pengembalian buku siswa\n• Melakukan pendataan buku yang terdapat di perpustakaan\n• Melakukan pendataan inventaris yang ada di laboraturium dan ruang kelas\n• Menyiapkan dan membuat arsip untuk dokumen monitoring dan evaluasi sekolah\n• Memeriksa kelengkapan dokumen dan membuat arsip sertifikat uji kompetensi siswa\n• Membuat rekapan data pelanggaran tata tertib siswa di sekolah\n• Membuat rekapan data vaksin siswa\nPENGALAMAN KERJA\nOnline Shop (Rubynoona)\nOwner (Oktober 2020 – saat ini)\n• Menyusun strategi pemasaran melalui e-commerce dan media sosial\n• Melayani pelanggan mulai dari pengenalan hingga pengiriman produk\n• Bertanggung jawab atas pengemasan dan pengiriman produk ke pelanggan dengan tepat\nwaktu\nBill Jilbab\nPramuniaga (Januari 2023 – saat ini)\n• Melayani pelanggan mulai dari pengenalan produk hingga produk sampai ditangan\npelanggan\n• Menyusun rekapan data penjualan produk\n• Melakukan pendataan stock produk\n• Mengorganisir display produk toko hingga menciptakan visual yang baik\nPENDIDIKAN\nUNIVERSITAS NEGERI MALANG (2018 - 2022)\nS1 Pendidikan Akuntansi - IPK 3,74\nSMAN 8 MALANG (2014 - 2017)\nJurusan MIPA\nKEMAMPUAN\n● Ms. Word\n● Ms. Excel\n● Ms. Powerpoint\n● Kerjasama Tim\n● Berkomunikasi dengan Baik\n● Cepat Beradaptasi\n● Motivasi Belajar Hal Baru\nS\nki',
'AJI IRVANSYAH\n089643163865 | ajiirvansyah98@gmail.com\nJL Raya Ngijo RT 05 RW 05 Ngijo Karangploso\nSaya memiliki pengalaman kerja sebagai staf IT support Rumah Sakit Prasetya Husada. Dapat mengoperasikan\nMs.Office. Saya juga cepat mempelajari hal baru, jujur, rajin, mampu bekerja secara mandiri maupun tim\nWork Experiences\nRS Prasetya Husada - Malang Apr 2021 - Apr 2022\nStaf IT Support\nBertangung jawab pada perawatan serta maintance hardware software serta sistem informasi management rumah sakit\nMembuat Laporan bulanan terkait jasa medis dokter\nMenginput data vaksin yang dilaksanakan di rumah sakit maupun saat perbantuan keluar rumah sakit\nInstalasi Operating System untuk perangkat komputer dari Rumah Sakit\nTroubleshooting Perangkat Hardware dan Software\nSMK Negeri 2 Singosari - Malang Nov 2020 - Dec 2020\nGuru Praktik\nMengajar Mata Pelajaran Administrasi Sistem Jaringan kelas XI dan XII jurusan Teknik Komputer dan Jaringan\nMembuat Video Pembelajaran untuk mata Pelajaran Admnistrasi Sistem Jaringan\nPT Deliv Tehnologi Indoraya - Malang Jun 2020 - Aug 2020\nStaf Magang\nSoftware Tester Aplikasi Android Kios Deliv\nMenghandle 525 Case dari 10 Modul Aplikasi Android Kios Deliv Menggunakan Metode Blackbox Testing\nSoftware Tester Aplikasi Web Kios Deliv\nMenghandle 746 Case dari 20 Modul Aplikasi Web Kios Deliv Menggunakan Metode Blackbox Testing\nMembuat Dokumentasi Software Tester\nMembuat Report Hasil Software Tester\nPT Panca Anugrah Abadi - Malang Dec 2022 - Apr 2023\nStaf Quality Control\nMengecek barang hasil produksi sesuai dengan standard yang ada\nMengontrol bagian produksi terkait dengan kualitas produk\nMengontrol kinerja dari bagian produksi\nMembantu pengerjaan bagian display produk\nPT Panca Anugrah Abadi - Malang May 2023 - Present\nStaf Administrasi\nMelakukan entri data produksi\nMembuat rekapan data hasil produksi\nMembuat laporan hasil produksi secara rutin\nMembuat rekapan absensi karyawan\nEducation Level\nUniversitas Brawijaya - Malang Aug 2017 - Jan 2022\nBachelor Degree in Pendidikan Teknologi Informasi, 3.30/4.00\nMenjadi Juara 3 Pekan Kreatifivitas Mahasiswa Tingkat Fakultas\nMengikuti Organisasi Keluarga Besar Mahasiswa Pendidikan Teknologi Informasi\nMengikuti beberapa kepanitiaan yang dilaksnakan oleh Eksekutif Mahasiswa UB, Badan Eksekutif Mahasiswa Ilmu Komputer, serta\nKeluarga Besar Mahasiswa Pendidikan Teknologi Informasi\nOrganisational Experience\nKeluarga Besar Mahasiswa Pendidikan Teknologi Informasi - Malang Oct 2018 - Dec 2019\nStaff Advokesma\nBertanggung Jawab melakukan pendampingan terhadap kepada mahasiswa yang memiliki masalah administrasi baik akademik\nmaupun keuangan\nBertanggung Jawab memberikan informasi terkait dengan akademik dan beasiswa\nBertanggung Jawab menampung aspirasi mahasiswa untuk disampaikan kepada pihak dekanat\nSkills, Achievements & Other Experience\nAchievements (2020): Microsoft Office\nWebinars Attended (2019): BEKRAF Developer Day',
]
query_embeddings = model.encode_query(queries)
document_embeddings = model.encode_document(documents)
print(query_embeddings.shape, document_embeddings.shape)
# [1, 768] [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(query_embeddings, document_embeddings)
print(similarities)
# tensor([[0.6023, 0.5846, 0.4976]])
devEmbeddingSimilarityEvaluator| Metric | Value |
|---|---|
| pearson_cosine | 0.931 |
| spearman_cosine | 0.929 |
sentence_0, sentence_1, and label| sentence_0 | sentence_1 | label | |
|---|---|---|---|
| type | string | string | float |
| details |
|
|
|
| sentence_0 | sentence_1 | label |
|---|---|---|
Deskripsi Pekerjaan |
||
Memberikan perawatan spa dan terapi tubuh kepada klien sesuai dengan standar profesional, termasuk pijat, facial, body scrub, dan perawatan kecantikan lainnya. |
||
Memastikan pengalaman klien nyaman, relaksasi, dan memuaskan dengan memberikan pelayanan yang ramah dan profesional. |
||
Membersihkan dan mempersiapkan ruangan perawatan sebelum dan sesudah sesi terapi. |
||
Memberikan rekomendasi produk atau perawatan tambahan yang sesuai dengan kebutuhan klien. |
||
Memahami dan mematuhi protokol kesehatan, kebersihan, dan keselamatan di area spa. |
||
Menjaga kerahasiaan dan privasi klien selama sesi perawatan. |
||
Bekerja sama dengan tim untuk memastikan operasional spa berjalan lancar. |
||
Kualifikasi Minimum |
||
Pengalaman sebagai Spa Therapist atau bidang terkait lebih disukai. |
||
Memiliki sertifikasi di bidang pijat, kecantikan, atau terapi spa |
||
Kemampuan komunikasi yang baik dan sikap ramah terhadap klien. |
||
Penampilan rapi dan menjaga kebersihan diri. |
||
Ringkasan Perkerjaan |
||
TINGKAT POSISI |
||
... |
Andhira Aulya Ayu |
0.185991957783699 |
Deskripsi Pekerjaan |
||
Research, write, and edit high-quality content for websites, social media, newsletters, marketing campaigns, and other channels. |
||
Collaborate with the AE/visual/creative strategist teams to align content with brand voice, style, and strategy. |
||
Proofread and self-edit to ensure grammar, clarity, and consistency. |
||
Stay up to date with industry trends and content performance metrics to optimize future content. |
||
Meet deadlines and manage multiple writing projects simultaneously. |
||
Working closely with other departments to align social media strategies with broader company goals. |
||
Kualifikasi Minimum |
||
Proven experience as a content writer, copywriter, or similar role (portfolio or writing samples required). |
||
Excellent writing, editing, and proofreading skills in crowdfunding |
||
Strong research skills and the ability to translate complex information into clear, engaging content. |
||
Ability to work independently and collaboratively in a fast-paced environment. |
||
Have experience... |
Amelia Wahyu Dewanti |
0.2327113896608352 |
Deskripsi Pekerjaan |
||
Memimpin semua kegiatan administrasi di kantor cabang (kelengkapan, ketepatan, dan up to datenya arsip file dan data - data di Cabang) |
||
Bertanggung jawab atas kelengkapan, pemeliharaan, efektivitas dan efisiensi penggunaan seluruh prasarana dan sarana yang dibutuhkan untuk menunjang operasional Cabang |
||
Menjamin terlaksananya sistem dan prosedur serta peraturan perusahaan yang berlaku dengan baik |
||
Menjamin keakuratan pengelolaan persediaan barang dan penyimpanannya, baik secara administratif maupun fisik |
||
Kualifikasi Minimum |
||
Laki - laki, maksimal usia 30 tahun |
||
Lulusan S1 Akuntansi / Manajemen Ekonomi |
||
IPK minimal 2.75 |
||
Masa studi maksimal 6 tahun |
||
Dapat mengendarai mobil (memiliki SIM A) |
||
Bersedia ditempatkan di cabang distributor di seluruh Indonesia |
||
Ringkasan Perkerjaan |
||
TINGKAT POSISI |
||
Lulusan Baru / Junior |
||
SPESIALISASI |
||
Administration and Coordination |
||
PERSYARATAN TINGKAT PENDIDIKAN |
||
Lulus program Sarjana (S1) |
||
RESPON REKRUTER KE LAMARAN |
||
Always |
||
ALAMAT KANT... |
Aldian Dwi Iswara aldian.d.iswara@gmail.com / +62 812 3299 0654 / Surabaya, Indonesia |
0.0641827061772346 |
CosineSimilarityLoss with these parameters:{
"loss_fct": "torch.nn.modules.loss.MSELoss"
}
per_device_train_batch_size: 2per_device_eval_batch_size: 2num_train_epochs: 1fp16: Truemulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 2per_device_eval_batch_size: 2per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robinrouter_mapping: {}learning_rate_mapping: {}| Epoch | Step | Training Loss | dev_spearman_cosine |
|---|---|---|---|
| 0.1207 | 500 | 0.0225 | - |
| 0.2414 | 1000 | 0.0106 | - |
| 0.3621 | 1500 | 0.0071 | - |
| 0.4829 | 2000 | 0.0063 | - |
| 0.6036 | 2500 | 0.0061 | - |
| 0.7243 | 3000 | 0.0055 | - |
| 0.8450 | 3500 | 0.005 | - |
| 0.9657 | 4000 | 0.0045 | - |
| 1.0 | 4142 | - | 0.9290 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Base model
google/embeddinggemma-300m