Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 13
How to use GyuBack/multilingual-e5-large-instruct-FT_klue_mrc_full32b with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("GyuBack/multilingual-e5-large-instruct-FT_klue_mrc_full32b")
sentences = [
"감각 뉴런이 감정을 격렬하게 느낄 때 이 뉴런은 어떻게 반응하는가?",
"연체동물에서 쉽게 볼 수 있는 수축 반사 행동이 군소의 아가미에서 연구되었다. 군소의 등쪽에는 아가미를 덮고 있는 막과 막에 연결되어 있는 호흡관 구조를 볼 수 있다. 군소의 호흡관 피부를 자극하면 감각 뉴런이 격발하고 이 뉴런은 글루타메이트를 시냅스로 방출한다. 글루타메이트 분자들은 운동뉴런 수용기를 활성화 시킨다. 충분히 많은 수용기가 활성화 되면 운동뉴런은 활동전위를 발생시켜 아가미의 근육이 수축하게 된다. 이것을 아가미 수축반사라 하고 이를 통해 습관화 ,민감화, 고전적 조건화를 살펴볼 수 있다.\n습관화는 군소의 흡수관을 약하지만 반복적으로 건드릴 때 나타난다. 처음의 자극은 아가미 철회반응을 일으키지만 계속 이어지는 흡수관자극으로 일어나는 반응은 크기가 작아지는 현상이다. 이는 흡수관의 자극을 맡는 감각 뉴런의 축색에서 가용한 글루타메이트의 소낭수의 점진적 감소 때문이다, 또한 시냅스의 삭제에 의해서도 억제될 수 있다.\n민감화는 세로토닌에 의해 유발된 글루타메이트의 증가에 의해 가용한 글루타메이트의 소낭 수를 증가시킨다. 이는 소낭으로부터 신경전달 물질을 방출하도록 한다. 신경전달물질의 증가에 의해 작은 자극에도 아가미 수축반응을 유발할 수 있다.\n고전적 조건화는 흡수관터치(CS)가 꼬리에 충격을 가하는 것(US)과 반복적으로 연합될 때, 증가된 흡수관 철회반응(CR)은 후속의 흡수관 터치에 대한 반응으로 이어진다. 연합 훈련에 뒤따르는 흡수관 터치(CS)에 대한 증가된 흡수관 철회반응은 꼬리 충격을 단독으로 제시할 때 발생하는 일반화된 민감화 보다 꽤 크다. 더욱이 고전적 조건화된 흡수관 철회반응(CR)은 또한 흡수관 특정적이어서 다른 자극들에는 일반화 되지 않는다. 이때 US와 CS가 서로 다른 시간에 투여되면 이러한 기억 효과를 볼 수가 없고 흡수관 터치 CS가 US보다 1/2초 이전에 제시될 때만 조건화가 발생한다.",
"재즈 보컬리스트 다이애나 크롤(Diana Krall)이 가을에 어울리는 새 앨범으로 돌아왔다. 다이애나 크롤은 지난달 25일 음원으로 선공개한 새 앨범 'This Dream Of You'를 오늘(15일) 오프라인 발매한다. 재즈 레이블 버브(Verve)를 통해 선보이는 이번 앨범은 재즈의 가장 낭만적인 면모를 담은 앨범 ‘Turn Up The Quiet (2017)’과 같은 시기에 녹음된 곡들을 모아 담았다. ‘Turn Up The Quiet’가 달콤한 봄이었다면 신보 ‘This Dream Of You’는 덤덤하고 건조한 가을밤으로 표현된다. 다이애나 크롤의 매력적인 피아노 연주에 존 클레이튼 주니어의 베이스, 제프 해밀튼의 드럼, 앤서니 윌슨의 기타가 함께 한 쿼텟, 그리고 오케스트라 협연이 다시 한 번 우리의 귀를 사로잡는다. 앨범명이자 타이틀 곡인 'This Dream Of You'는 밥 딜런이 2009년에 발표한 앨범 ‘Together Through Life’에 담긴 곡을 노래한 것이다. 좋은 곡이지만 널리 알려지지 않았던 곡을 느린 템포를 사용해 상실감을 강조하며 가을의 쓸쓸함을 느끼게 한다. 다이애나 크롤의 오랜 친구이자 프로듀서인 토미 리푸마의 유작이기도 한 이번 앨범은 그가 사랑했던 곡 ‘But Beautiful’로 시작한다. 이어 가을 풍경으로 초대하는 ‘Autumn In New York’, 다이애나의 독창성이 돋보이는 ‘I Wished On The Moon’이 이어지며 ‘Singing In The Rain’으로 끝맺음 한다. 다이애나 크롤은 “이번 앨범이 소중한 사람과 함께 나누고 싶은 한 편의 영화 같길 바란다”고 밝혔다.",
"GE는 오는 2018 평창동계올림픽대회가 열리는 모든 올림픽대회 경기장에 최첨단 종합 배전(配電) 시스템을 공급한다고 밝혔다. 이번 올림픽대회에 활용될 GE의 선도 기술은 전기 공급 과정에서 계측, 감시, 제어, 보호, 절체 등 종합적 기능을 수행한다. 특히 올림픽대회 경기장과 국제방송센터(IBC)를 비롯한 올림픽 시설에 어떤 경우에도 중단되지 않고 연속으로 전기를 공급하는 무정전 전원공급장치(UPS)를 설치하여, 안정적인 전력을 공급한다. 이를 통해 올림픽대회 기간 동안 발생할 수 있는 전력 관련 사고를 예방하고 보다 빠르고 민첩하게 대응하여, 원활한 경기 진행을 위한 필수 인프라로서 역할을 담당할 예정이다. GE는 UPS 시스템의 상태를 면밀히 확인하고 긴급상황 시 신속한 조치를 하기 위해 전문가 26명으로 구성된 팀을 배치할 예정이다. 네트워크로 연결된 UPS 시스템은 정비가 필요한 시스템 성능, 전력 품질의 변동, 전력공급 중단 등 관련 상황을 실시간으로 감시하고 공유하게 된다. GE 전문가들은 현장에서 이러한 데이터를 지속적으로 분석하여 UPS가 원활한 올림픽 운영에 필수적인 고품질 전력의 안정적 공급과 예방대책을 제공할 수 있도록 할 방침이다. 이와 더불어 17일간의 대회기간 동안 24시간 가동될 국제방송센터(IBC)에는 고압배전반, 변압기, 무정전 절체장치(ATS)등을 포괄하는 GE의 종합 배전 시스템이 구축된다. 평창 마운틴 클러스터(Mountain Cluster) 중심지에 위치한 IBC는 6천여 명의 국내외 방송 관계자들의 작업장이자 75억 세계인에게 생생한 올림픽 경기를 생중계하는 중대한 역할을 맡는다. GE의 고압배전반은 전력제어 및 복합적 보호 기능과 온도, 습도를 알려주는 디지털 기능을 탑재해 온도 및 주변환경이 장비에 끼칠 수 있는 영향을 최소화함으로써 동계 올림픽 시즌에서 발생할 수 있는 기기 오작동 확률을 낮추게 된다. 전력 공급이 끊기지 않도록 관련 선로의 고압배전반을 원방 통신으로 감시, 제어, 절체하는 무정전 절체장치(ATS)는 디지털 방식의 PLC(Programmable Logic Controller) 기술에 기반하여 최초 프로그래밍 된 이후 완전히 자동으로 동작하도록 설계됐다."
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from intfloat/multilingual-e5-large-instruct. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'한국에서 에볼라 바이러스 검사를 하기 위해서 필요한 실험실은?',
'중동호흡기증후군(MERS·메르스)에 대한 정부의 부실한 대응은 구멍 뚫린 방역안보의 현실을 그대로 보여줬다는 지적이다. 지금과 같은 대응 역량으로는 생물테러는커녕 에볼라와 같은 고위험 바이러스도 감당할 수 없다는 게 전문가들의 평가다. ▶관련기사 A4,5,26면국내 감염병 환자는 지난해 9만2730명으로 2009년(3만9224명)과 비교해 5년간 2.4배 늘었다. 하지만 감염병에 대응하는 보건복지부 산하 질병관리본부의 인원과 예산은 ‘제자리걸음’이다. 익명을 요구한 국방전문가는 “한국은 감염병 전문인력은 둘째치고 에볼라 수준의 바이러스를 안전하게 검사할 실험실조차 없다”고 밝혔다.치사율이 50~90%에 달하는 에볼라 바이러스는 생물안전 4등급(BL4) 실험실에서 다뤄야 한다. 그러나 국내엔 메르스 정도의 바이러스를 다룰 수 있는 3등급(BL3) 실험실만 20여곳 있다. 한국에 에볼라가 발병하면 안전한 검사 자체가 불가능하다는 얘기다. 한 감염내과 전문의는 “국가 격리 음압병상이 158개에 불과한 점도 에볼라 같은 고위험 바이러스가 확산됐을 때 치명적 약점”이라고 말했다.조성권 한성대 행정대학원 교수는 “미국은 2001년 탄저균 테러사건 이후 감염병을 국가안보 차원에서 대처하고 있다”며 “우리도 메르스 사태를 계기로 안보 차원에서 감염전문가 양성과 공중보건실험실, 음압병실 확대 등에 적극 투자해야 한다”고 강조했다.',
'중국의 ‘부동산 공룡’으로 꼽히는 완다그룹이 이랜드그룹의 레저사업에 투자하기로 했다. 완다그룹은 특히 투자금액을 “이랜드가 결정하는 대로 주겠다”고 약속했다고 이랜드 측은 전했다.이랜드그룹은 박성경 부회장과 왕젠린 완다그룹 회장이 지난 5일 중국 베이징에서 레저사업에 대한 투자합의서를 체결했다고 10일 발표했다. 이랜드가 국내 각지에서 추진 중인 리조트, 호텔, 테마도시 등 레저사업에 완다그룹이 투자한다는 내용이다. 투자 규모는 아직 정해지지 않았다. 이랜드는 “구체적인 사업계획과 투자액을 우리가 정해 완다그룹에 제안하면 완다그룹은 이를 받아들이기로 했다”고 밝혔다.완다그룹을 이끄는 왕 회장은 개인 재산이 1350억위안(약 22조원)으로, 지난해 중국 후룬연구소가 발표한 중국 내 부호 1위에 올랐다. 그는 중국에서 백화점, 쇼핑몰, 부동산개발 등으로 사세를 키웠고 2012년 미국 영화관 체인 AMC엔터테인먼트와 지난해 영국 요트 제작업체 선시커를 인수하는 등 해외로 보폭을 넓히고 있다.완다그룹은 이랜드와 비슷하게 레저사업에도 강한 의욕을 보여왔다. 2017년까지 하얼빈, 우시 등 중국 주요 도시에 ‘테마도시’ 7개를 건설한다는 계획을 갖고 있다. 이랜드는 완다그룹과 10여년 전부터 끈끈한 파트너십을 유지해온 점이 이번 투자 유치로 이어졌다고 설명했다. 이랜드 관계자는 “오래전부터 완다그룹이 보유한 쇼핑몰에 패션매장이 대거 입점하는 등 우호적인 관계를 유지하고 있다”며 “왕 회장이 개인적으로 만나는 한국 기업인은 박 부회장뿐”이라고 말했다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
sentence_0 and sentence_1| sentence_0 | sentence_1 | |
|---|---|---|
| type | string | string |
| details |
|
|
| sentence_0 | sentence_1 |
|---|---|
현행범을 검거한 경찰의 이름은 무엇인가? |
보이스피싱 사기 현행범이 서울의 한 새마을금고에서 범죄 수익금을 인출하려다 새마을금고 직원들의 순발력과 기지로 현장에서 체포됐다.지난 16일 서울 사당동 동작새마을금고 1분소에 근무하는 최유선 대리(35·사진)는 심모씨(36)를 수상하게 바라봤다. “인테리어 사업을 하는 친구에게 돈을 건네주기로 했다”며 3000만원을 빼간 뒤 10여분 만에 돌아와 1000만원을 추가 인출해줄 것을 요청했기 때문이다. 하지만 10분 전만 해도 인출이 가능했던 심씨의 계좌는 지급정지가 걸려 있었다. 은행원을 사칭한 보이스피싱 사기단에 속아 OTP(일회용 비밀번호 생성기) 비밀번호를 불러줬던 피해자가 뒤늦게 신고한 것이다.최 대리는 “당시에는 지급정지 사유를 몰랐지만 갑자기 지급정지가 걸린 점을 고려할 때 문제가 있다고 생각했다”며 “최근 횡행하는 보이스피싱 범죄가 떠올랐다”고 말했다. 그는 놀란 마음을 진정시키며 뒷자리에 있는 탁경영 분소장에게 메신저로 “보이스피싱 의심 계좌라 경찰에 신고해야 한다”고 쪽지를 보냈다. 심씨에게는 “전산오류니 잠시 기다려 달라”며 음료를 주는 등 시간을 끌었다.탁 분소장은 “문 앞에 주차된 차를 빼달라고 해야겠다”고 둘러대고 밖으로 나가 동작경찰서에 신고했다. 곧 출동한 경찰은 심씨를 현행범으로 체포하고 사기 등 혐의로 입건했다. |
마르크수 주의를 주장하는 사람들이 자본국가를 어떻게 지칭하는가? |
자본국가(資本國家, capitalist state)란 자본주의 사회경제체제에 따라 굴러가는 국가다. 일반적으로 "근대국가" 개념과 상호 혼용될 수 있다. 다만 자본국가들은 서로 공통점만큼 차이점도 상당히 많다. |
매장에 시계, 도자기 등 다양한 영역의 제품들을 구비하고 있는 브랜드의 이름은? |
현대백화점이 27일 서울 삼성동 무역센터점의 수입 패션 브랜드를 44개에서 72개로 늘려 다시 오픈했다. 국내 최대 크기의 명품 매장을 독특한 1, 2층 복층 형태로 내는 등 강남 상권을 잡기 위한 대형화에 주력했다.현대백화점 무역센터점에 들어간 해외 패션 및 시계, 화장품 브랜드는 총 120여개로, 이 중 에르메스(254㎡) 루이비통(839㎡) 까르띠에(330㎡)는 국내 백화점 중 가장 큰 규모다. 까르띠에는 다음달 22일 2층과 연결된 복층 매장으로 열고, 루이비통은 오는 7월께 1, 2층에 복층 구조로 매장을 낸다. 에르메스 매장에는 백화점 매장으론 유일하게 의류 잡화뿐 아니라 시계, 크리스털, 테이블웨어, 가죽, 도자기, 향수 등 14개 제품군을 모두 들여놨다. 시계도 강화한다. 기존에 264㎡였던 명품 시계 매장을 891㎡로 확대, 강남 상권 최대 규모로 마련했다. 위블로, 오데마피게, 예거 르쿨르트, 피아제 등 10개 브랜드를 새로 들여놓는다. 이 중 예거 르쿨트르와 쇼메 등 9개 브랜드는 부티크 형태의 단독 매장으로 다음달 22일 문을 연다. |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
per_device_train_batch_size: 32per_device_eval_batch_size: 32num_train_epochs: 1batch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 32per_device_eval_batch_size: 32per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Falsehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseeval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falsebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robin| Epoch | Step | Training Loss |
|---|---|---|
| 0.6840 | 500 | 0.2767 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
intfloat/multilingual-e5-large-instruct