Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
•
1908.10084
•
Published
•
11
This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("forestav/job_matching_sentence_transformer")
# Run inference
sentences = [
"Filip Orestav \nTransformatorvägen 6, Sollentuna , Sweden \n+46 76 873 30 77 | orestav@kth.se | LinkedIn \n \nAmbitious fourth -year Industrial Engineering and Management student at KTH, pursuing a Master's in Machine \nLearning. Entrepreneurial spirit with a track record of founding a successful consulting and investment company, \noptimizing operations at a fund company, leading people at a supermarket store and driving growth for Sweden's \nlargest youth platform. \n \nEDUCATION \nKTH Royal Institute of Technology Stockholm, Sweden \nM.Sc. Industrial Engineering and Management GPA: 4. 57/5 \nMaster in Machine Learning Expected graduation 2026 \n \nRudbecksgymnasiet Stockholm , Sweden \nNatural Sciences 21.09/22.5 \n Graduated 2021 \nKEY SKILLS \n• TECHNICAL: Python, Java, JavaScript, SQL, Machine Learning, Deep Learning \n• BUSINESS: Financial analysis, Business analysis, Consulting, Project management , Strategic planning \n• SOFT SKILLS: Critical thinking, Problem solving, Time management, Entrepreneurial spir it\nPROFESSIONAL EXPERIENCE \nKTH Royal Institute of Technology Stockholm , Sweden \nLab Assistant October 2024 – present \n● Reviewed and assessed students' code and understanding of course labs in a Natural Language Processing \n(NLP) course \n● Evaluated implementations of key NLP techniques and algorithms, including Levenshtein Distance, Viterbi \nAlgorithm, n -gram Language Models, Gradient Descent, and Random Indexing, ensuring correctness and \nadherence to best practices \n● Provided feedback and guidance to support students' learning and understanding of advanced NLP concepts \n● Grading theoretic al exam questions \n \nProtean Funds Scandinavia Stockholm , Sweden \nOperations Officer (CFO replacement during summer) May 2024 – August 2024 \n● Overseen fund operations and control functions , achieving a 100% trade execution rate \n● Automated visualization tasks in Excel, Python and Power BI \n● Assisted fund managers, CFO and CEO with research for fund expansion \n● Ensured compliance with the Digital Operational Resilience Act and other relevant regulations \n \nKreditz Stockholm , Sweden \nResearch Intern Jan 2024 – June 2024 \n● Developed state-of-the-art deep learning models for bank transaction categorization, utilizing MLP, LSTM, \nand CNN architectures \n● Enhanced model performance by 100x in speed while maintaining industry -leading accuracy \n \nKnowit Ascend Stockholm , Sweden \nAdept Jan 2024 – May 2024 \n● Introduction and practical experience of, among others, the management consultant job, case -solving, and the \nmanagement consulting toolkit \n● Bridged the gap between theory and practice, utilizing frameworks and ideas learnt from studies \n \n \nPromotely AB Sollentuna, Sweden \nFounder & CEO 2021 – present \n● Growing a multifaceted business focusing on SEO, affiliate marketing, investments and consulting \n● Developed a comprehensive understanding of business operations, competition strategies and value creation \n \nHemköp Upplands Väsby, Sweden \nSales Associate 2019 – present \n● Ensured smooth daily store operations, from inventory management to customer service \n● Contributed to making the store the most successful in the city, enhancing customer satisfaction and \nprofitability \nYepstr Sollentuna, Sweden \nBusiness Developer 2017 – 2019 \n● Played a key role in scaling Sweden's largest youth employment platform through targeted user acquisition \nand strategic community initiatives \n● Provided tutoring services in physics, mathematics, and English with a 100% satisfaction rate \n \nLANGUAGES, ACTIVITIES & INTERESTS \nLanguages: Swedish (native), English (proficient), Spanish (basic) \nActivities: Former Equity Analyst at KTH Finance Club; Former m ember of Startup/VC Club \nInterests: All kinds of sports, cooking, technological innovation \nFuture: Seeking opportunities at the intersection of technology and management, with a focus on leveraging \nmachine learning for societal benefit and exploring innovative business model s\n ",
'Vi söker nu dig som har ett genuint intresse för teknik och maskiner! Är du redo för nästa steg i karriären? I en entreprenöriell miljö, med stort fokus på utveckling och glädje får du möjligheten att utvecklas tillsammans med oss på Kendrill.\nUrvalet sker löpande: Vi går igenom ansökningarna i den ordningen vi får in dem och kan komma att tillsätta tjänsten löpande. Vi rekommenderar därför att du skickar in din ansökan så snart som möjligt för att öka dina chanser! 💫\nOm oss\nVi på Kendrill erbjuder professionell utrustning för demolering, håltagning och berg. Med en gedigen kompetens som vår grund hjälper vi våra kunder med allt från uthyrning till reparation, service och rådgivning. Vårt fokus är att erbjuda lösningar som passar just våra kunder. Vi finns idag på tre depåer utspridda i Stockholm, Göteborg och Oslo.\nHos Kendrill trivs du i en entreprenöriell miljö med ett högt tempo och kollegor som delar din passion. Vi är stolta över att vara ett ungt och snabbväxande företag som har blivit Sveriges ledande uthyrare av rivningsrobotar och hydraulspräckare på rekordtid.\nVåra kärnvärden engagerad, beslutsam, lösningsorienterad och lagspelare är en mycket viktig del av vår verksamhet. Som anställd delar du dessa med oss och arbetar dagligen för att säkerställa att vi lever upp detta.\nVad kan vi erbjuda dig?\nSom medarbetare hos oss på Kendrill får du möjligheten att arbeta i en entreprenöriell anda. Här går laget för jaget och tillsammans arbetar vi för att leverera förstklassig service. Vi erbjuder dig en inspirerande miljö, i ett företag präglat av glädje, gemenskap och ett stort mått av utmaning för dig som är redo att ta nästa steg.\nVi arbetar i fina lokaler och erbjuder en god arbetsmiljö!🔧\nFör oss på Kendrill är det viktigt att ha roligt på jobbet! Tillsammans med vår depå i Göteborg träffas vi årligen för jul- och sommarfester och teamaktiviteter. Vi erbjuder marknadsmässiga löner, pension, försäkringar och friskvårdsbidrag. \nOm rollen \nI rollen som Mekaniker a',
'Vi söker\nDig som har en socionomexamen och som har flerårig chefserfarenhet inom målgrupperna äldre, LSS samt Socialpsykiatri\xa0till en kommun i Stockholms län. Uppdraget startar 1 februari och pågår under våren 2025 på heltid.\xa0\nFör att vara rätt person för tjänsten ska du;\n– Ha en socionomexamen\n– Ha minst tre års erfarenhet av\xa0ansvar för personal, verksamhet, ekonomi.\xa0\xa0\n– Ha minst tre års erfarenhet av arbete inom myndighetsutövning.\n– Du ska ha minst tre års erfarenhet av kommunala uppdrag, vara insatt och förstå kommunala uppdrag.\n– Har du erfarenhet av arbete inom alla målgrupper är det meriterande för tjänsten. Även om du har kompetens inom grupputveckling.\xa0\n– Som ledare är du strukturerad och stabil, analytisk och samarbetsorienterad.\xa0\n– Du behöver kunna vara en förebild och tillämpa kommunens värdegrund i ledarskapet.\n– Du ska ha goda kunskaper i svenska språket, i både tal och skrift.\n– Du ska kunna arbeta på arbetsplatsen.\n– Ha B-körkort.\nArbetsuppgifter\nSedvanliga arbetsuppgifter för Enhetschef för avdelning för myndighetsutövning. Budget-, personal- och verksamhetsansvar. Enhetschefen har det övergripande ansvaret för att styra, leda och kvalitetsutveckla verksamheten tillsammans med medarbetarna samt ansvara för att kontinuerligt utveckla personalgruppen.\xa0\nUppdraget omfattar att arbeta med grupputveckling inom en av teamen då fokus behöver stärkas gällande samarbete och samsyn i ärendehantering.\nAnställning\nDu kommer att bli anställd som konsult för Vårdlänken Bemanning Rekrytering, med varierande arbetstider och tjänstegrad efter överenskommelse.\nSom konsult hos oss erbjuds du:\n• Konkurrenskraftig lön och intressanta uppdrag i olika verksamheter\n• Kollektivavtal, tjänstepension, friskvårdsbidrag och semesterersättning\n• Stora möjligheter att själv välja arbetsplats och arbetstider\n• Hjälp med resa och boende om du arbetar på annan ort\n• Introduktion och kontinuerlig coachning så att du snabbt kommer in i din roll\n• En dedikerad och tillgänglig konsultch',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
sentence_0, sentence_1, and label| sentence_0 | sentence_1 | label | |
|---|---|---|---|
| type | string | string | float |
| details |
|
|
|
| sentence_0 | sentence_1 | label |
|---|---|---|
Kolumbus Lindh |
kolumbuslindh@gmail.com education KTH ROYAL INSTITUTE OF TECHNOLOGY Stockholm, Sweden, GPA 4.7 / 5 M.Sc in Industrial Engineering and Management Aug 2023 - Jun 2025 Specializing in Machine Learning Monash University Melbourne, Australia Exchange Programme Jul 2022 - Jun 2023 Focusing on finance KTH ROYAL INSTITUTE OF TECHNOLOGY Stockholm, Sweden, GPA 4.4 / 5 B.Sc Industrial Engineering and Management Aug 2020 - Jun 2023 Specializing in Computer Science Bachelor’s Thesis: Deep Learning for Bank Transaction Categorization work experience hoomies.se Stockholm, Sweden Co-Founder Aug 2024 - Current Startup aiming to make vacations affordable and sustainable Responsible for Full stack development In charge of the business aspect through competitor analysis, niche profiling and revenue models EF Education First Barcelona, Spain ... |
Vi söker |
CV – Peter Lindh |
Om rollen |
0.0 |
Kolumbus Lindh |
kolumbuslindh@gmail.com education KTH ROYAL INSTITUTE OF TECHNOLOGY Stockholm, Sweden, GPA 4.7 / 5 M.Sc in Industrial Engineering and Management Aug 2023 - Jun 2025 Specializing in Machine Learning Monash University Melbourne, Australia Exchange Programme Jul 2022 - Jun 2023 Focusing on finance KTH ROYAL INSTITUTE OF TECHNOLOGY Stockholm, Sweden, GPA 4.4 / 5 B.Sc Industrial Engineering and Management Aug 2020 - Jun 2023 Specializing in Computer Science Bachelor’s Thesis: Deep Learning for Bank Transaction Categorization work experience hoomies.se Stockholm, Sweden Co-Founder Aug 2024 - Current Startup aiming to make vacations affordable and sustainable Responsible for Full stack development In charge of the business aspect through competitor analysis, niche profiling and revenue models EF Education First Barcelona, Spain ... |
Rekryteringsträffen kommer att äga rum den 30 januari 2025 mellan kl 14.00 - 16.00 |
CosineSimilarityLoss with these parameters:{
"loss_fct": "torch.nn.modules.loss.MSELoss"
}
per_device_train_batch_size: 16per_device_eval_batch_size: 16multi_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 3max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robin@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}