Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper • 1908.10084 • Published • 13
How to use GyuBack/multilingual-e5-large-instruct-FT_klue_mrc_full16b with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("GyuBack/multilingual-e5-large-instruct-FT_klue_mrc_full16b")
sentences = [
"예니체리가 완전히 해산되었을 시기 재위 중인 황제는?",
"1364년 무라드 1세가 처음 세웠다. 초기는 전쟁포로들이나 비이슬람교도, 특히 발칸지방 기독교 소년들로 강제 징집한 병사들로 구성되었다. 일단 징집당하면 이슬람과 튀르크 전통을 익힌 뒤 이슬람으로 개종해야했고 엄격한 신체훈련과 각종무기를 다루는 기술을 익힌후에 부대로 편성됐다.\n일종의 개인경호대로 알라와 황제 이외에는 그 어느누구에게도 복종하지 않았다. 평상시에는 황제가 머무는 수도 경비를 맡아 일종의 경찰관이나 소방관 같은 역할을 하다 전쟁나면 최정예부대로 참전하여 무용을 떨쳤다.\n특별한 군복을 지급받았고 상비군으로서 급여를 지급받았으며 다른 이슬람교도와 달리 콧수염 외 수염을 기르지 않았다. 초기에 결혼 및 병영밖에서 사는 것이 금지되었을 정도로 엄격한 규율하에 생활했는데 16세기에 금혼규정을 비롯한 일부 규정이 완화되었다\n제정 로마 근위대가 본래 목적보다는 황제의 최대위협이 된 것처럼 예니체리도 영향력이 막강해지자 점차 탐욕스러워지고 권력집단화 돼 정치에 관여하며 타락했다. 18세기에 이르며 막강한 특권과 영향력으로 정부를 장악하고 군대 구조 현대화를 위한 시도들을 방해하고 자기들 입맛에 맞는 정책들을 강요하며 빈번히 반란을 일으켰고 심지어 황제조차 갈아 치울 수 있을 정도였다. 1622년에는 예니체리를 해체하고 군대를 재조직하려고 시도한 오스만 2세를 암살했다\n1807년에는 반란을 일으켜 군대를 유럽식으로 현대화 하려던 셀림 3세를 끌어내리고 이어 마무드 2세가 권좌에 올랐다. 마무드 2세도 반대했으나 결국 타협했고 10년 이상을 권력보강에 힘썼다\n권력남용, 군사적 비효율성, 개혁 반대, 135,000명의 봉급 지급에 따른 재정압박 등으로 한계에 다다르자 마침내 마무드 2세는 예니체리를 뿌리뽑기로 결정했다\n1826년 새로운 군대를 조직한다는 사실이 알려지자 또다시 반란을 일으켰다. 1826년 6월 14일과 15일 이스탄불에서 반란군은 결국 군대에 밀려 그들의 막사로 후퇴했고 마무드 2세는 포병에게 막사에 일제히 발포하라 명하고 15문의 대포로 일제사격을 감행하여 반란군 대부분을 학살했다. 살아남은 자들도 거의 대부분 유배되거나 처형당했다. 2년 후 마지막으로 남은 예니체리 부대를 압수, 해산하며 예니체리는 전부 해체됐다.",
"“노조 파업으로 자동차 생산라인이 멈춰서고, 하청업체는 일감 부족으로 고통을 받는 악순환을 언제까지 반복해야 하는지…. 이젠 ‘파’자만 들어도 진절머리가 납니다.”현대자동차 노조가 ‘이틀간 부분파업 돌입’을 결정한 19일 오후. 울산 북구 중산 자동차 부품단지 내 엔진부품 업체인 M기업 김모 회장(53)은 망연자실한 표정으로 이렇게 말했다. 김 회장은 “중소부품사들 입장에선 납품받는 현대차보다 연례행사하듯 파업하는 노조가 더 무섭다”며 “주말특근 거부의 충격에서 벗어날 만하니까 또 파업한다”고 비난했다.○27년간 23차례 파업 현대차노조는 이날 쟁의대책위원회를 열고 20, 21일 울산 아산 전주 등 모든 공장에서 1조(오후 1시30분~3시30분), 2조(오후 5시30분~7시30분) 각 2시간 총 8시간 부분파업하기로 결정했다. 지난해 강경 성향의 문용문 집행부가 들어선 이후 두 번째 파업이다. 노조는 당초 파업 일정을 20~22일 3일로 잡았다가 조합원 반발로 이처럼 조정한 것으로 전해졌다. 회사 측은 “중앙노동위원회의 추가 협의(조정연기) 권고를 노조가 거부했다”고 설명했다. 노조는 올해 임단협안을 통해 △정년 61세 연장 △기본급 13만498원 인상 △순이익 30% 성과급 지급 △상여금 800% 지급 △퇴직금 누진제 △대학 미진학 자녀에게 기술취득 지원금 1000만원 지급 등을 요구하고 있다. 회사 측은 “성과급을 제외한 임금 인상과 퇴직금 누진제, 정년 연장 등 신규 요구만 따져도 7000만원에 이른다”고 주장했다. 회사 관계자는 “노조의 임단협안 75개 조항 180개 항목을 노사가 함께 한번 읽어본 정도인데, 일괄 타결안을 내놓으라는 것은 파업 수순밟기에 불과하다”며 대화 재개를 촉구했다. 노조 측은 “사측이 조합원의 고용과 복지 요구에 대해 기존 단협보다 후퇴한 안을 제시하고 타결 의지도 보이지 않고 있다”며 “진실된 대화 의지를 보여라”고 맞섰다.노조는 22일 사측과 18차 본교섭을 갖고 2차 쟁대위도 개최할 계획이다. 회사 측 제시안이 부족하다고 판단하면 투쟁 수위를 단계적으로 높여갈 가능성이 높은 것으로 관측된다.○반발하는 울산시민·협력업체울산지역 현대차 중소협력업체들은 추석 대목을 앞두고 벼랑 끝으로 내몰리고 있다며 반발했다. 북구 효문동의 한 부품업체 사장은 “파업 강도를 높이면 추석 전 도산하는 업체도 생겨날 것”이라고 걱정했다.협력업체들은 파업 장기화를 우려하고 있다. 현대차노조는 지난해 28일간 파업을 벌여 회사 측에 차량 8만2000여대, 1조7000억원의 손실을 입혔다. 노조 설립 이래 임금 협상으로 초강경 파업에 나선 첫 사례로 꼽힌다. 울산에는 500여개의 협력업체에 4만여명이 일하고 있다. 가족까지 포함하면 현대차와 직간접적으로 연관된 인원은 15만여명으로 추산된다. 현대차 인근 매곡 부품공장에서 일하는 김광수 씨(42)는 “협력업체 근로자는 열심히 일해도 연봉 5000만원 이상을 받기 힘들다”며 “업계 최고 연봉을 받으면서 심야근무도 안 하고 1억원을 더 받겠다니 이해하기 힘들다”고 반발했다.울산상공회의소와 140여개 시민사회단체로 구성된 행복도시만들기울산협의회(행울협)는 조만간 노조를 방문, 파업 중단을 촉구하기로 했다. 김철 울산상의 회장(행울협 공동위원장)은 “노조 파업으로 현대차가 생산차질 물량을 불가피하게 해외로 돌리면 협력업체 줄도산이 우려된다”며 “파국을 막는 길은 노조의 파업 자제뿐”이라고 지적했다.",
"1943년 슈타우펜베르크는 중령으로 진급했으며, 북아프리카로 건너가 제 10 기갑사단의 참모장을 맡게 되었다 북아프리카 전선에서 슈타우펜베르크는 작전 지역을 시찰하던 중, 1943년 4월 7일에 영국 전투기의 습격을 받아 중상을 입는다. 그는 독일 본토로 이송되어 뮌헨의 병원에서 치료를 받으며 석달동안 입원하였다. 여기서 그는 왼쪽 눈과 왼쪽 손, 오른쪽 손가락 두 개를 잃게 된다. 뮌헨 병원에서 재활치료를 받는 동안, 그는 생각만 하고 있었던 히틀러 암살계획에 가담하여 자신의 손으로 히틀러를 해치우기로 결심하게 된다. 히틀러 제거 계획은 이미 재활 치료를 거의 마친 이후 독일 육군 본부에 보직을 받고 루트비히 베크를 중심으로 한 22명의 가담자들을 만나고 난 뒤부터였다.\n\n1943년 7월 1일 슈타우펜베르크는 대령으로 진급하면서 독일 베를린 국방군 본부의 예비군 참모장으로 임명되었다.\n올브리히트장군의 군사령관 후임인 프리드리히 프롬을 상관으로 만나게 되는데, 프롬도 이미 히틀러 제거 음모에 묵시적으로 가담했었다. 즉, 프롬은 '반나치세력'에 대해 모든 것을 알고 있으면서도 모르는체 하면서 슈타우펜베르크의 거사에 협조했다.\n\n1944년 6월 6일, 미국,영국,캐나다 연합군이 프랑스 노르망디에 상륙작전을 감행했다. 이때 슈타우펜베르크도 다른 고위 장교들과 마찬가지로 전쟁이 패배로 돌아갈 것을 확신했다. 그는 즉각 휴전하는 것만이 인명의 불필요한 희생을 막고 독일과 독일 국민, 그리고 유럽 대다수 국가들의 피해를 최소화하며 자신의 조국을 구하는 길이라고 확신했다. 1943년 말에 슈타우펜베르크는 독일의 즉각 휴전 조건으로서 연합국이 납득할 만하다고 생각하는 것들을 요구서로 적어 보냈다. 요구서에는 독일 국경을 폴란드의 비엘코폴스카와 포즈나뉴가 포함되는 1914년 국경으로 인정해 줄 것을 비롯해, 오스트리아와 주데텐란트 지방을 독일 영토로 유지하며, 알자스-로렌 지방에는 자치권을 부여하고, 남쪽으로는 현 전시 국경에서 확장해 티롤, 볼자노, 메라노 등까지 병합하는 것 등이 포함되어 있었다. 비영토 관련 요구는 연합군의 독일 점령을 일절 불허할 것과, 전범 인계를 거부한 것 등이 있었다. 전범 인계 거부는 자국 범죄자는 그 나라가 심판할 권리가 있다는 이유에서였다. 이 요구 사항들은 서방 연합국에만 국한된 것일 뿐 동부전선(러시아 전선)에는 해당되지 않는 것이었다. 그는 '독일은 서쪽, 북쪽, 남쪽 지역에서만 물러나고, 동쪽 점령지에 대해서는 군사적 점령 상태를 유지할 권리'를 요구했다. 하지만 노르망디에 연합군이 상륙한 뒤, 루트비히 베크를 주축으로 한 '반나치세력'들과 슈타우펜베르크는 이러한 위기에 서방연합군과의 휴전 협상 시도가 명목적이었을 뿐임을 깨달았다. 독일의 무조건 항복만이 전쟁에 종지부를 찍을 수 있었다."
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]This is a sentence-transformers model finetuned from intfloat/multilingual-e5-large-instruct. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'WHO가 23일에 우한 폐렴과 관련해서 전세계에 선포한 것은?',
'1월 24일, 중국 춘제가 시작되자마자 한국과 일본에서 각각 두 번째 우한폐렴 감염자가 확인됐다. 대한민국의 두 번째 우한폐렴 감염자는 중국 우한에서 근무하던 한국 국적의 55세 남성인 것으로 확인됐다WHO(세계보건기구)는 23일(현지시간) 우한폐렴이 중국 내에서만 크게 유행하고 있고 다른 나라에서는 사람 간 전염 증거가 없으며 사망자 대부분이 면역력이 약한 노인이고 대다수의 건강한 성인에게는 가벼운 증상만을 유발한다며 이번 사태가 아직 국제 공중보건 비상사태에 해당하지 않는다며 국제 공중보건 비상사태를 선포하지 않았다. 이날 오후 8시 49분 기준, 중국에서 889명, 총 910명이 감염되어 이 가운데 26명이 사망하였다. 중국 보건당국은 우한 외에 후베이성 다른 7곳의 도시에 추가로 여행금지령을 내리면서 사실상 봉쇄했다. 8곳은 우한, 황강, 어저우, 츠비, 셴타오, 첸장, 징먼, 지장 등이다. 이들 도시에선 열차, 비행기 등 다른 도시와 연결되는 대중교통 수단 공급이 전면 중단되고 대중이 모이는 장소는 폐쇄된다.',
'“귀신 잡는 해병이라 귀신 앞에서도 긴장이 안됐는데, 면접관 앞에서는 바짝 긴장되더라고요.”(한기홍 대위) “칼바람 부는 백령도보다 면접장이 더 춥게 느껴졌어요.”(채운석 대위)‘귀신 잡는 해병’도 입사 면접관 앞에서는 떨고 있었다. 70~100명을 거느리는 중대장들이지만, 면접장에서는 수험생과 다를 바 없었다.롯데그룹 채용담당 면접관들이 오는 6월 전역하는 해병대 장교를 위해 ‘군부대를 찾아가는 특별채용 면접’을 진행했다. 롯데의 5개 계열사(제과, 칠성, 마트, 하이마트, 코리아세븐) 채용담당자들이 해병 장교를 뽑기 위해 경기도 해병대사령부를 찾은 것이다. 작년에 이어 2년째 진행된 채용 프로그램이다.면접에 나온 장교 14명은 해병대 사령부의 추천을 통해 선발됐다. 정부교 해병대 대외협력관은 “취업준비 여건이 미비한 전방에서만 5년 이상 복무한 우수 장교”라며 “롯데그룹에 입사해 크게 기여할 수 있는 이들을 추천했다”고 말했다. 면접에 온 이들의 나이는 29~33세. 복무기간 5~10년인 중기 복무 장교들이다.오전 10시부터 시작된 역량면접은 1인당 30~40분씩 진행됐다. 역량면접을 하고 나온 권혁이 대위는 “지원동기, 1분 자기소개, 지원회사인 하이마트와 군생활 중 기억나는 것에 대한 질문을 받았다”며 “6년간 군생활을 통해 대한민국 최고의 해병대 장교로 경험한 것을 토대로 최고의 유통기업 롯데에서 꿈을 펼치고 싶다”고 포부를 밝혔다.롯데마트에 지원한 정성현 대위는 “부대원들과 갈등상황을 잘 해결한 사례를 물었다”고 말했다. “임관 후 부대원들의 ‘소대장 길들이기’에 처음엔 화도 났지만, 진심으로 다가가 말을 건네고 생활관에서 부대원들과 함께 자고 하면서 먼저 속마음을 열었더니 그들도 다가왔다는 점을 소개했죠.”여성 장교 2명도 지원했다. 해병대 군생활 7년차인 배은진 대위(롯데마트 지원)는 “결혼한 주부로서 롯데마트 일산점에서 장을 보면서 느낀 점을 적극 어필하겠다”고 말했다. 안혜영 대위(하이마트 지원)는 “체력과 정신력에서 일반 대졸자들보다 더 자신 있다”며 “여군 장교는 대부분 자원 입대자이기에 ‘남군’보다 더 열정적으로 군복무를 한다”고 설명했다. 해병대 훈련을 받으면서 선후배로 같은 방을 썼다는 이들은 “좋은 결과가 나와 롯데그룹 연수 때도 같은 방을 쓸 수 있었으면 좋겠다”는 바람을 내비쳤다.오후에 진행된 인성면접은 면접관 2명에 지원자 3명이 나란히 앉아서 면접을 보는 형식으로 진행됐다. 면접장을 막 나온 송은희 대위(코리아세븐 지원)는 “멘붕이었다”며 “일반 사회를 모르고 정보도 턱없이 부족해 예상 질문과 대답을 외우고 또 외웠는데 면접관의 질문에 앞이 깜깜했었다”고 전했다.제주도에서 왔다는 한기홍 대위(롯데마트 지원)는 “‘해병대가 나를 철들게 했다’고 말해 면접장이 웃음바다가 됐다”고 소개했다. 그는 “해병대에서 사람을 신뢰하고 신뢰시키는 법을 배웠다”며 “부족해도 열심히 노력하면 못할 게 없다는 것도 해병대에서 배웠다”고 말했다.롯데칠성에 지원한 최원희 대위는 면접장에 들어가기 전 “초등학교 때 전단을 돌리는 것을 시작으로 중학교 때는 군고구마 장사, 고교 시절엔 노래방 ‘알바’로 다져진 영업정신을 어필할 계획”이라며 “여기에 해병대 리더십까지 덧붙이면 분명히 뽑아줄 것으로 확신한다”고 자신 있게 말했다.이날 면접관으로 참석한 김진성 롯데그룹 인사팀 수석은 “장교들은 국가기여형 인재로서 리더십·책임감·국가관이 검증된 인재”라며 “앞으로도 롯데는 해병정신으로 무장된 해병장교를 계속 채용할 방침”이라고 밝혔다. 이번 면접 결과는 오는 27일께 발표될 예정이며, 입사일은 전역 후인 7월 중이다. 롯데는 내달 중 전역장교를 대상으로 한 채용설명회도 진행할 예정이다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
sentence_0 and sentence_1| sentence_0 | sentence_1 | |
|---|---|---|
| type | string | string |
| details |
|
|
| sentence_0 | sentence_1 |
|---|---|
삼성이 애플의 아이폰보다 더 많은 선호도를 받았던 스마트폰은 무엇인가? |
애플의 아이폰을 도입한 이후로 KT와 삼성간의 불화가 일기 시작하였다. 아이폰 출시로 인해 스마트폰 부분에서 삼성은 매출과 이미지에 타격을 입었으며, 삼성의 대표적인 스마트폰인 옴니아2의 만족도 조사와, 스마트폰 선호도 조사에서 삼성은 애플에 크게 떨어져 굴욕을 맛보아야 했다. 삼성은 그에 따라 KT에 대한 불편한 심기를 감추지 않았으며, 이후 삼성의 각종 스마트폰 출시에서 KT가 제외되거나, 보조금 지급 대상에서 제외되거나, 업그레이드를 해주지 않거나, 심지어 '쇼옴니아' 명칭 조차 사용할 수 없게 하는 KT에 대한 삼성의 차별이 시작되었다. KT는 아이폰을 출시함으로 인해 큰 영향력을 행사하는 계기가 되었으나, 대한민국 최대 휴대폰 제조사인 삼성과의 불화로 인해 대한민국의 스마트폰을 원활하게 확보하기가 어렵게 되는 위기에 처하기도 하였다. 이후 SK텔레콤을 통해서 출시된 삼성의 스마트폰 '갤럭시' 시리즈도 몇개월 이상 지나서 KT에서 출시되었으며 삼성의 '바다' 운영 체제를 탑재한 '웨이브'는 KT에서 아예 출시 할 계획이 없는 것으로 알려졌다. 이렇게 KT가 삼성에게 차별을 받고 있는 상황을 IT 업계에서는 "KT가 국내 휴대전화 단말기와 통신 서비스업체 사이에 묵시적으로 합의한 스마트폰 무시 전략을 눈치 없이 깨고, 아이폰이라는 금단의 열매를 베어 문 탓에 박해를 받고 있다"고 분석하기도 한다. KT의 이석채 회장은 삼성에 대해 "기업을 하는데 감정을 갖고 있으면 안 된다"고 말하거나, 쇼옴니아 명칭을 사용할 수 없게 하는데 대해 "쇼옴니아는 아버지를 아버지라 부르지 못하는 홍길동 신세"라고 하는 등 삼성에 대해 불편한 심기를 드러내기도 하였다. |
제 1차 중동 전쟁에서 이집트 민족주의자들이 팔레스타인을 지원했던 년도는? |
1882년 영국군은 앵글로-이집트 전쟁을 통하여 이집트 정치에 개입하기 시작하였다. 1888년 콘스탄티노플 협약을 통해 영국은 이집트의 수에즈 운하를 군사 점령하게 되었다. 제1차 세계 대전 당시 이집트는 오스만 제국령에서 일정한 수준의 독립 권리를 누리고 있었다. 이 시기 이집트 국왕인 압바스 2세는 영국에 대해 강한 반감을 갖고 있었고 그 결과 동맹국을 지원하였다. 승전한 영국은 패전국인 오스만 제국의 이집트 영토를 강제적으로 자국의 식민지로 편입하였다. |
목포해경이 세월호의 구조신호를 받은 날은? |
‘세월호’ 침몰 사고를 일으킨 청해진해운이 사고 발생 직후 곧바로 인양선(크레인)을 호출하지 않아 인명 구조에 도움을 줄 수 있는 크레인 출발이 최장 12시간가량 지연된 것으로 드러났다. 해사안전법에 따르면 사고를 낸 선사는 침수 위험이 있을 때 곧바로 크레인을 사고 현장에 부를 수 있도록 연락을 취해야 하지만 청해진해운은 이 같은 최소한의 안전규정조차 지키지 않았다.17일 해양경찰청에 따르면 세월호가 “침수가 시작됐다”며 목포 해경에 구조를 요청한 시간은 지난 16일 오전 8시58분쯤이다. 하지만 청해진해운은 곧바로 크레인을 호출하지 않았다. 해양수산부는 뒤늦게 이런 사실을 파악하고 황급히 구난업체와 계약해 경남 거제 등에 있던 삼성중공업, 대우조선해양, 해양환경관리공단의 해상 크레인 세 척을 사고 현장에 급파했다.하지만 최초 호출이 늦어지면서 이들 업체와 기관이 사고 현장으로 크레인을 출발시킨 시간은 최초 사고 보고 시점으로부터 적게는 9시간, 길게는 12시간이 흐른 뒤였다. 이에 따라 대우조선해양 크레인은 18일 오전 1시쯤에야 겨우 사고 지점에 도착했다. 해양환경관리공단과 삼성중공업 크레인은 이보다 늦은 같은 날 오전 7시와 오후 2시에야 현장에 도착한다.실종자 가족들은 인명 구조를 위해 정부가 선체 일부라도 시급히 수면 위로 끌어올리기를 기대하고 있지만 크레인 도착이 늦어지면서 발만 동동 구르고 있다. 현재 사고 현장에선 ‘언딘’이라는 수중작업 전문업체가 크레인이 도착하면 선체를 끌어 올릴 수 있도록 미리 쇠줄을 잇는 작업을 할 예정이다.해수부는 크레인 세 척이 도착하는 대로 인양 작업에 나서는 방안을 검토 중이다. 침몰한 선박 전체를 수면 위로 완전히 끌어올리지는 못해도 선체 일부를 수면 위로 끌어올리는 것은 가능할 것으로 보고 있다.한편 청해진해운의 김한식 대표는 이날 밤 9시께 기자회견을 열고 “이번에 희생된 분들과 유가족에게 진심으로 사죄한다”고 말했다. |
MultipleNegativesRankingLoss with these parameters:{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
per_device_train_batch_size: 16per_device_eval_batch_size: 16num_train_epochs: 1batch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robinoverwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 16per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 1max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Falsehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseeval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falsebatch_sampler: no_duplicatesmulti_dataset_batch_sampler: round_robin| Epoch | Step | Training Loss |
|---|---|---|
| 0.3420 | 500 | 0.1984 |
| 0.6840 | 1000 | 0.108 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
Base model
intfloat/multilingual-e5-large-instruct