|
|
--- |
|
|
tags: |
|
|
- sentence-transformers |
|
|
- cross-encoder |
|
|
- reranker |
|
|
- generated_from_trainer |
|
|
- dataset_size:35108 |
|
|
- loss:BinaryCrossEntropyLoss |
|
|
base_model: klue/roberta-small |
|
|
pipeline_tag: text-ranking |
|
|
library_name: sentence-transformers |
|
|
--- |
|
|
|
|
|
# CrossEncoder based on klue/roberta-small |
|
|
|
|
|
This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [klue/roberta-small](https://huggingface.co/klue/roberta-small) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text reranking and semantic search. |
|
|
|
|
|
## Model Details |
|
|
|
|
|
### Model Description |
|
|
- **Model Type:** Cross Encoder |
|
|
- **Base model:** [klue/roberta-small](https://huggingface.co/klue/roberta-small) <!-- at revision b6b4c36d827e0293ae2fcf04d527072f10a23064 --> |
|
|
- **Maximum Sequence Length:** 512 tokens |
|
|
- **Number of Output Labels:** 1 label |
|
|
<!-- - **Training Dataset:** Unknown --> |
|
|
<!-- - **Language:** Unknown --> |
|
|
<!-- - **License:** Unknown --> |
|
|
|
|
|
### Model Sources |
|
|
|
|
|
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net) |
|
|
- **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html) |
|
|
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) |
|
|
- **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder) |
|
|
|
|
|
## Usage |
|
|
|
|
|
### Direct Usage (Sentence Transformers) |
|
|
|
|
|
First install the Sentence Transformers library: |
|
|
|
|
|
```bash |
|
|
pip install -U sentence-transformers |
|
|
``` |
|
|
|
|
|
Then you can load this model and run inference. |
|
|
```python |
|
|
from sentence_transformers import CrossEncoder |
|
|
|
|
|
# Download from the 🤗 Hub |
|
|
model = CrossEncoder("cross_encoder_model_id") |
|
|
# Get scores for pairs of texts |
|
|
pairs = [ |
|
|
['선진국이 외국 기업을 대우하기 위한 제도는?', '현오석 부총리 겸 기획재정부 장관이 중소기업 보호를 위해 공공조달 시장에서 ‘국내외 대기업에 대한 동등 규제’ 원칙을 밝힘에 따라 정부가 세부 규제 방안 마련에 들어갔다. 정부는 특히 이 같은 규제는 외국 기업만을 대상으로 한 규제와 달리 세계무역기구(WTO) 43개 가입국이 맺고 있는 정부조달협정(GPA)에 위배되지 않는다는 입장을 분명히 했다. ▶본지 11월11일자 A1, 3면 참고○정부, “공공시장 역차별 시정”기재부 관계자는 11일 “내부 검토 결과 국내 대기업과 외국 대기업을 동등하게 규제하는 것은 국제적으로 문제가 안 된다”며 “선진국도 세제 지원, 진입 장벽 설치, 재정 지원 등을 통해 자국 중소기업을 100% 보호하고 있다”고 말했다. 외국 기업을 차별 대우하면 문제가 되지만 그렇지 않으면 국제법상 문제가 없다는 것이다.이 관계자는 이어 “중소기업 보호를 위해 국내 대기업을 배제했는데 (국내 대기업보다 덩치가 큰) 외국계 대기업이 들어오는 건 문제가 있다는 점이 국정감사에서도 여러 번 지적됐다”며 “이런 현상을 방치할 수 없다는 게 정부 방침”이라고 강조했다. 일부에서 ‘외국계 대기업 규제가 국내 시장을 지키려다 해외 시장을 잃는 조치 아니냐’는 지적이 나오는 데 대해서도 “해외 시장 포기가 아니라 국내 기업이 받는 역차별 해소 차원”이라고 적극 반박했다. 중소기업을 위해 남겨둔 자리를 외국계 기업이 치고 들어오면 국내 대기업이 역차별을 받는 것은 물론 중소기업 사이에서도 ‘외국계 기업과 제휴를 하느냐 못하느냐’에 따라 공공조달 시장에서 차별을 받을 수 있다는 이유에서다. 기재부는 이에 따라 조만간 산업통상자원부 중소기업청 조달청 등 관계부처와 협의해 현 부총리가 밝힌 규제 방안을 다듬는 작업에 나서기로 했다. 기재부 내부적으로는 이미 지난주에 검토 작업을 한 차례 했다. 통상 주무부처인 산업부도 이미 내부적으로는 이 같은 국내외 동등 규제는 WTO 협정에 위배되지 않는다는 판단을 내렸다. 산업부의 관계자는 “중소기업 보호를 위한 예외 적용은 정부조달협정뿐 아니라 자유무역협정(FTA)에도 명문화돼 있다”고 말했다. ○규제 방식은 ‘신중’정부는 구체적인 규제 방안이 나오려면 시간이 필요하다는 반응을 보였다. 중소기업 보호를 위해 국내 대기업뿐 아니라 외국계 대기업도 규제해야 한다는 방향성은 서 있지만 구체적으로 어떻게 해야 정교한 방안을 짜낼 수 있을지는 신중히 검토해야 한다는 것이다.기재부 관계자는 “우리가 보호하려는 중소기업의 범위를 어떻게 정할지, 통상 마찰 논란은 어떻게 대응할지, 자산 총액 5조원 이상 대기업 집단을 규제하는 상호출자제한 기업집단 규제를 외국계 기업에 확대 적용한다면 어떻게 할지 등 다양한 이슈가 걸려 있다”며 “중소기업청 산업부 공정거래위원회 조달청 등 다른 부처와 충분히 협의해 결정할 사안”이라고 말했다. 주용석/조미현 기자'], |
|
|
['워렌이 스스로 영화를 제작할 수 있음을 입증하여 승부에서 이긴 상대는 누구인가?', '“마노스: 운명의 손”은 워렌의 고향인 텍사스주 엘 파소에 있는 카프리 극장에서 1966년 11월 15일 시사회를 가졌다. 워렌은 시사회에 쓰려고 서치라이트를 구했으며 헐리우드 분위기를 내기 위해 캐스트가 탈 리무진을 대여했다. 하지만 리무진 한 대 밖에 대여가 안 되었으므로, 캐스트를 반으로 나누어 한 그룹을 시사회로 태우고, 다시 리무진을 돌려 기다리고 있던 나머지 그룹을 근처 모퉁이에서 태우고 시사회로 데려와야했다. 시사회에는 시장, 지역 보안관 등 지역의 주요 인사들이 다수 초대되었다. 영화가 시작한 지 얼마 지나지 않아, 시사회장은 웃음으로 가득찼다. 워렌과 나머지 출연진은 민망해진 채로 재빨리 출구를 통해 빠져나갔다. 시사회 후, 워렌은 자신이 보기에도 “마노스”가 최악의 영화라고 생각하지만 그래도 자랑스럽다고 밝혔다. 또한, 잘만 다듬으면 재밌는 코미디 영화로 만들 수 있을 것 같다는 얘기도 인터뷰에서 하였다\n\n이 영화는 에머슨 사가 배포를 맡았다. 또한 카프리 극장에서 잠시 동안 상영되었으며, 텍사스 서부의 드라이브인 극장에서도 상영이 되었다. 어떤 보고에 따르면 작업의 대가를 받은 스탭은 잭키 니먼 존스와 그녀의 강아지 뿐이었으며, 그 대가도 자전거와 다량의 강아지 음식이었다고 하는데, 이는 영화가 재정적으로 얼마나 크게 실패했는지를 보여준다 공식 박스오피스 집계는 알려져있지 않다. 영화에 대한 반응은 좋지 않았으나, 워렌은 자신이 혼자 영화를 만들 수 있음을 증명하여, 스털링 실리펀트와의 내기에서 승리하였다'], |
|
|
['장편소설 분야에 지원할 때, 작품 외에 별도로 써야 하는 글은 몇 장인가?', '부산대 철학과에 다니는 홍준성 씨(24)는 지난해 가을 학생 신분으로 제3회 한경 청년신춘문예의 문을 두드렸다. 홍씨는 철학과 책을 좋아하는 평범한 학생이었다. 신춘문예 장편소설 부문에 당선되며 그의 삶은 변했다. 상금을 여비 삼아 전국을 여행하며 이야기를 수집했다. 강원 호남 영남 등 역사적 비극을 지닌 곳을 찾아다니며 이야기를 들었다. 당선 전까지만 해도 말하기를 좋아했던 젊은 청년은 어느새 타인의 말을 귀 기울여 듣는 젊은 작가로 변신했다. 홍씨는 올해 문학동네 작가상 본심에 이름을 올리는 등 신춘문예 당선이 우연이 아니었음을 증명해 나가고 있다. 그의 청년신춘문예 당선작 열등의 계보(은행나무)는 퇴고를 거듭해 이달 정식 출간된다.좋은 작품은 그것을 읽는 사람의 인생은 물론 만든 사람의 인생도 바꾼다. 가장 좋은 사례가 신춘문예다. 문학 지망생으로서 끝없는 습작의 나날을 보내던 이들은 신춘문예라는 관문을 거쳐 작가로 변신한다.제2회 장편소설 당선자인 김의경 씨(36)의 당선작 청춘파산(민음사)은 젊은 세대가 겪는 어려움을 솔직하게 표현해 호평받은 작품이다. 이 소설에는 김씨가 겪은 일들이 상당 부분 녹아 있다. 김씨는 집안이 어려워지는 바람에 어린 시절 해 보지 않은 아르바이트가 없을 정도였다.김씨는 지난 2월 한국문화예술위원회와 서울 프린스호텔이 후원하는 창작집필실 입주작가 프로그램에 선정돼 한 달 동안 호텔에서 집필에 전념했다. 호텔에서 펜을 잡자 대학생 시절 호텔 주방에서 설거지했던 기억이 떠올랐다. “호텔에서 글을 쓰니 옛날 생각이 나서 기분이 묘했어요. 호텔에서 일할 때는 정문으로 들어갈 수도 없는 신세였는데 말이죠.” 정식 작가가 된 뒤 더 큰 책임감을 느끼고 있다는 그는 이달 두 번째 작품을 탈고할 계획이다.제3회 시 부문 당선자 김민율 씨(37)는 등단 이전과 별다를 것 없어 보이는 일상을 보내고 있다. 하지만 그에게도 분명한 변화가 생겼다. “등단 전에는 좀 편안하게 시를 썼는데 등단한 뒤로는 책임감 있게 시를 쓰려고 한다”고 김씨는 말했다. “그래서 더 예민한 상태를 유지하려고 노력합니다. 시를 썼다는 데 만족하지 않고 이 시를 통해 무엇을 할 수 있을까 고민하고 있어요.”제2회 시 부문 당선자 이소연 씨(32)도 “작품을 쓴 사람은 읽는 사람보다 주제에 대해 더 깊이 생각할 수밖에 없다”며 “작품을 쓰면서 내 자신이 바뀌어가는 것을 느낀다”고 말했다.신인 작가를 발굴·육성하고 문화콘텐츠를 발굴하기 위한 한경 청년신춘문예가 4회를 맞았다. 제3회부터 만 39세 이하까지 참여할 수 있도록 폭을 넓혔다. 20대 대학생부터 작가의 꿈을 놓지 않은 30대 지망생에게까지 문이 열려 있다.올해는 시, 장편소설, 시나리오 등 세 개 부문에서 새로운 작가를 찾아 나선다. 장편소설 부문은 3000만원의 상금을 준다. 원고량은 200자 원고지 기준 1000장 안팎이며 10장 분량의 줄거리 설명을 따로 제출해야 한다. 시는 5편 이상 제출해야 하며, 시나리오 원고는 400장 안팎(시놉시스 10장 별도)이다. 시와 시나리오 상금은 500만원씩이다.원고는 A4 용지에 출력해서 보내야 한다. 응모작은 과거에 발표했거나 입상한 적이 없는 순수 창작물이어야 한다. 다른 공모전에 중복 투고해 이미 입상한 작품이거나 표절한 사실이 밝혀지면 당선을 취소한다. 봉투에 ‘한경 청년신춘문예 응모작품’이라 적고 작품 첫 장과 마지막 장에 응모 부문, 이름(필명일 경우 본명 병기), 주소, 전화번호, 원고량(200자 원고지 기준), 주민등록상 생년월일을 명시해야 정식 응모작으로 접수한다. 모든 원고는 반환하지 않는다.'], |
|
|
['황광희가 배운 방언을 사용하는 도시는?', '정부가 발표한 ‘9·1 부동산 대책’ 가운데 국회를 거쳐야 할 입법 사항을 두고 갈등이 불거지고 있다. 9·1 대책 대부분은 정부 차원에서 시행령이나 규칙을 고치면 시행할 수 있는 내용이지만, 여야 합의를 통해 국회 통과가 필요한 택지개발촉진법(택촉법) 폐지, 청약제도 개편 등을 두고 야당이 반발하고 나섰다. 서울시도 재건축·재개발 등 정비사업 방식 개편에 반대해 추진에 어려움을 겪을 것이라는 전망이 나온다.지난 1일 정부가 발표한 규제완화안 42개 가운데 법 개정이 필요한 입법 사항은 모두 11개다. 새정치민주연합은 이 가운데 △택촉법 폐지 △공공관리제 개선(도시 및 주거환경정비법) △청약제도 개편(주택법) 등에 반대하고 있다. “서민주거안정 방안이 아니라 서울 강남권 중심의 부동산 경기 부양 정책”이라는 주장이다.우선 택촉법을 폐지하면 더 이상 신도시급의 대규모 주택 공급을 할 수 없어 집값 상승 우려가 있다는 게 야당 측 지적이다. 백재현 새정치연합 정책위 수석부의장은 “상대적으로 집값이 싼 택지지구가 사라지면 무주택 서민이 집을 장만하기는 더 어려워질 것”이라고 말했다. 국토교통부 관계자는 이에 대해 “주택 보급률이 100%를 넘은 데다 최근 주택 공급과잉으로 이미 지정된 대형 택지지구 상당수를 해제하고 있는 실정”이라며 “신도시급 대신 중소형 규모의 도시개발은 계속 추진할 것”이라고 설명했다.청약 가점제를 지방자치단체장이 자율 운영하도록 한 것도 무주택자 혜택을 줄이는 방안이라는 주장이 나온다. 현재 청약제도는 무주택 기간이 오래되고 부양가족이 많은 세대주에게 가점을 주고 있다. 이를 지자체장 자율에 맡길 경우 무주택 혜택이 사라질 가능성이 높다는 지적이다. 국토부 관계자는 “청약 과열이 우려되는 투기과열지구와 공공주택지구에 대해서는 가점제를 의무 적용해 무주택 서민에게 우선 공급할 계획”이라고 해명했다.공공관리제를 개선하는 도정법은 서울시가 반대하고 있다. 개선안은 토지 등 소유자 과반수가 원할 경우 사업시행인가 이전에 시공사를 선정할 수 있도록 한다. 서울시 조례보다 상위법인 도정법이 개정되면 지자체는 이를 따라야 한다. 서울시 관계자는 “시공사 선정을 앞당길 경우 사업비가 높아지고 조합원 간 갈등이 늘어날 가능성도 있다”고 주장했다. 이현진/이호기/김병근 기자'], |
|
|
['하르라이프 첫 시작부터 등장하는 캐릭터는?', '대전에 있는 선병원은 의료업계에선 ‘한류스타’로 통한다. 지난 4년간 이곳을 찾은 외국인 환자는 1만2000명이 넘는다. 2011년 854명에 불과했으나 지난해에는 5431명으로 급증했다. 이 기간 외국인 환자 증가율은 536%에 이른다.선병원은 국내외 병원들의 ‘벤치마킹’ 대상이다. 지금까지 이곳을 탐방하고 돌아간 국내 종합병원만 100곳에 이른다. 서울대병원과 삼성서울병원 등 내로라하는 종합병원들도 ‘자존심’을 내려놓고 선병원의 장점을 배우기 위해 찾고 있다.작년 한 해에만 일본·중국·러시아·베트남·태국·인도 등 해외 20여개국 의료기관들이 병원 경영을 배우러 왔다. 선병원은 넘치는 방문객들로 인해 업무에 지장을 받자 방문 가능한 날을 월 1회, 마지막주 금요일로 제한하기도 했다.선병원은 대전시내와 유성에 흩어져 있는 병상을 모두 합쳐야 900개 정도다. 규모로 보면 평범한 지방 종합병원이지만 각종 지표로 보면 성장세가 가파르다. 작년 말 기준으로 하루 외래 환자 수는 3500명 선이다. 외국인 환자 유치를 계기로 본격적인 변신을 시도한 4년 전과 비교하면 34.6% 증가한 것이다.서울에 있는 종합병원들에 비해 지리적으로 불리한 지방 병원이 ‘혁신의 아이콘’으로 불리는 비결은 무엇일까. 선승훈 의료원장은 “배울 수 있는 모든 것을 매뉴얼화한 결과”라고 설명했다. 선병원이 가장 심혈을 기울이는 것은 최고급 서비스를 벤치마킹하는 일이다. 선 원장은 “1년에 지구 네 바퀴 반을 돌면서 세계 각국의 혁신 사례를 모아 온다”고 했다. 그는 매년 한두 차례 직원 15~20명을 해외에 내보낸다. 그의 주문은 단 하나, “아무것도 생각하지 말고 최고급 서비스를 즐겨라”.혁신은 곳곳에서 이뤄졌다. 간호사들은 환자의 정보를 일일이 수첩에 적고 이를 전산으로 관리해 호평을 받고 있다. 4년 전 선 원장과 직원 20여명이 방문한 싱가포르 6성급 호텔인 카펠라호텔의 서비스에서 가져온 아이디어다. 상담직원들의 ‘발딱 응대’는 태국 방콕의 사미티벳 병원 간호사들이 의자에 앉아 있는 환자 가족 등과 눈높이를 맞추기 위해 무릎을 꿇는 것에서 배워왔다.싱가포르 창이국제공항, 홍콩국제공항 등도 ‘배움터’였다. 병원을 리모델링할 때 이용객 편의를 극대화한 국제공항의 동선을 적용했다.선병원은 지난달 중환자실을 5성급 호텔형으로 새로 꾸몄다. 중환자실 간호사들의 사무공간을 ‘펜타곤형’으로 정중앙에 배치, 환자들의 요구사항과 행동에 즉시 대응할 수 있도록 바꿨다. 별도 비용 없이 보호자가 환자 곁에서 머물 수 있도록 개별 침대와 욕실도 마련했다. 이규은 경영총괄원장은 “호텔의 장점을 접목한 중환자실을 갖추기 위해 신라호텔과 롯데호텔 등 국내 특급호텔은 물론 일본 벳푸 세이카이호텔, 홍콩 랑선플레이스 등 아시아 주요 호텔을 거의 빠짐없이 훑었다”고 전했다.'], |
|
|
] |
|
|
scores = model.predict(pairs) |
|
|
print(scores.shape) |
|
|
# (5,) |
|
|
|
|
|
# Or rank different texts based on similarity to a single text |
|
|
ranks = model.rank( |
|
|
'선진국이 외국 기업을 대우하기 위한 제도는?', |
|
|
[ |
|
|
'현오석 부총리 겸 기획재정부 장관이 중소기업 보호를 위해 공공조달 시장에서 ‘국내외 대기업에 대한 동등 규제’ 원칙을 밝힘에 따라 정부가 세부 규제 방안 마련에 들어갔다. 정부는 특히 이 같은 규제는 외국 기업만을 대상으로 한 규제와 달리 세계무역기구(WTO) 43개 가입국이 맺고 있는 정부조달협정(GPA)에 위배되지 않는다는 입장을 분명히 했다. ▶본지 11월11일자 A1, 3면 참고○정부, “공공시장 역차별 시정”기재부 관계자는 11일 “내부 검토 결과 국내 대기업과 외국 대기업을 동등하게 규제하는 것은 국제적으로 문제가 안 된다”며 “선진국도 세제 지원, 진입 장벽 설치, 재정 지원 등을 통해 자국 중소기업을 100% 보호하고 있다”고 말했다. 외국 기업을 차별 대우하면 문제가 되지만 그렇지 않으면 국제법상 문제가 없다는 것이다.이 관계자는 이어 “중소기업 보호를 위해 국내 대기업을 배제했는데 (국내 대기업보다 덩치가 큰) 외국계 대기업이 들어오는 건 문제가 있다는 점이 국정감사에서도 여러 번 지적됐다”며 “이런 현상을 방치할 수 없다는 게 정부 방침”이라고 강조했다. 일부에서 ‘외국계 대기업 규제가 국내 시장을 지키려다 해외 시장을 잃는 조치 아니냐’는 지적이 나오는 데 대해서도 “해외 시장 포기가 아니라 국내 기업이 받는 역차별 해소 차원”이라고 적극 반박했다. 중소기업을 위해 남겨둔 자리를 외국계 기업이 치고 들어오면 국내 대기업이 역차별을 받는 것은 물론 중소기업 사이에서도 ‘외국계 기업과 제휴를 하느냐 못하느냐’에 따라 공공조달 시장에서 차별을 받을 수 있다는 이유에서다. 기재부는 이에 따라 조만간 산업통상자원부 중소기업청 조달청 등 관계부처와 협의해 현 부총리가 밝힌 규제 방안을 다듬는 작업에 나서기로 했다. 기재부 내부적으로는 이미 지난주에 검토 작업을 한 차례 했다. 통상 주무부처인 산업부도 이미 내부적으로는 이 같은 국내외 동등 규제는 WTO 협정에 위배되지 않는다는 판단을 내렸다. 산업부의 관계자는 “중소기업 보호를 위한 예외 적용은 정부조달협정뿐 아니라 자유무역협정(FTA)에도 명문화돼 있다”고 말했다. ○규제 방식은 ‘신중’정부는 구체적인 규제 방안이 나오려면 시간이 필요하다는 반응을 보였다. 중소기업 보호를 위해 국내 대기업뿐 아니라 외국계 대기업도 규제해야 한다는 방향성은 서 있지만 구체적으로 어떻게 해야 정교한 방안을 짜낼 수 있을지는 신중히 검토해야 한다는 것이다.기재부 관계자는 “우리가 보호하려는 중소기업의 범위를 어떻게 정할지, 통상 마찰 논란은 어떻게 대응할지, 자산 총액 5조원 이상 대기업 집단을 규제하는 상호출자제한 기업집단 규제를 외국계 기업에 확대 적용한다면 어떻게 할지 등 다양한 이슈가 걸려 있다”며 “중소기업청 산업부 공정거래위원회 조달청 등 다른 부처와 충분히 협의해 결정할 사안”이라고 말했다. 주용석/조미현 기자', |
|
|
'“마노스: 운명의 손”은 워렌의 고향인 텍사스주 엘 파소에 있는 카프리 극장에서 1966년 11월 15일 시사회를 가졌다. 워렌은 시사회에 쓰려고 서치라이트를 구했으며 헐리우드 분위기를 내기 위해 캐스트가 탈 리무진을 대여했다. 하지만 리무진 한 대 밖에 대여가 안 되었으므로, 캐스트를 반으로 나누어 한 그룹을 시사회로 태우고, 다시 리무진을 돌려 기다리고 있던 나머지 그룹을 근처 모퉁이에서 태우고 시사회로 데려와야했다. 시사회에는 시장, 지역 보안관 등 지역의 주요 인사들이 다수 초대되었다. 영화가 시작한 지 얼마 지나지 않아, 시사회장은 웃음으로 가득찼다. 워렌과 나머지 출연진은 민망해진 채로 재빨리 출구를 통해 빠져나갔다. 시사회 후, 워렌은 자신이 보기에도 “마노스”가 최악의 영화라고 생각하지만 그래도 자랑스럽다고 밝혔다. 또한, 잘만 다듬으면 재밌는 코미디 영화로 만들 수 있을 것 같다는 얘기도 인터뷰에서 하였다\n\n이 영화는 에머슨 사가 배포를 맡았다. 또한 카프리 극장에서 잠시 동안 상영되었으며, 텍사스 서부의 드라이브인 극장에서도 상영이 되었다. 어떤 보고에 따르면 작업의 대가를 받은 스탭은 잭키 니먼 존스와 그녀의 강아지 뿐이었으며, 그 대가도 자전거와 다량의 강아지 음식이었다고 하는데, 이는 영화가 재정적으로 얼마나 크게 실패했는지를 보여준다 공식 박스오피스 집계는 알려져있지 않다. 영화에 대한 반응은 좋지 않았으나, 워렌은 자신이 혼자 영화를 만들 수 있음을 증명하여, 스털링 실리펀트와의 내기에서 승리하였다', |
|
|
'부산대 철학과에 다니는 홍준성 씨(24)는 지난해 가을 학생 신분으로 제3회 한경 청년신춘문예의 문을 두드렸다. 홍씨는 철학과 책을 좋아하는 평범한 학생이었다. 신춘문예 장편소설 부문에 당선되며 그의 삶은 변했다. 상금을 여비 삼아 전국을 여행하며 이야기를 수집했다. 강원 호남 영남 등 역사적 비극을 지닌 곳을 찾아다니며 이야기를 들었다. 당선 전까지만 해도 말하기를 좋아했던 젊은 청년은 어느새 타인의 말을 귀 기울여 듣는 젊은 작가로 변신했다. 홍씨는 올해 문학동네 작가상 본심에 이름을 올리는 등 신춘문예 당선이 우연이 아니었음을 증명해 나가고 있다. 그의 청년신춘문예 당선작 열등의 계보(은행나무)는 퇴고를 거듭해 이달 정식 출간된다.좋은 작품은 그것을 읽는 사람의 인생은 물론 만든 사람의 인생도 바꾼다. 가장 좋은 사례가 신춘문예다. 문학 지망생으로서 끝없는 습작의 나날을 보내던 이들은 신춘문예라는 관문을 거쳐 작가로 변신한다.제2회 장편소설 당선자인 김의경 씨(36)의 당선작 청춘파산(민음사)은 젊은 세대가 겪는 어려움을 솔직하게 표현해 호평받은 작품이다. 이 소설에는 김씨가 겪은 일들이 상당 부분 녹아 있다. 김씨는 집안이 어려워지는 바람에 어린 시절 해 보지 않은 아르바이트가 없을 정도였다.김씨는 지난 2월 한국문화예술위원회와 서울 프린스호텔이 후원하는 창작집필실 입주작가 프로그램에 선정돼 한 달 동안 호텔에서 집필에 전념했다. 호텔에서 펜을 잡자 대학생 시절 호텔 주방에서 설거지했던 기억이 떠올랐다. “호텔에서 글을 쓰니 옛날 생각이 나서 기분이 묘했어요. 호텔에서 일할 때는 정문으로 들어갈 수도 없는 신세였는데 말이죠.” 정식 작가가 된 뒤 더 큰 책임감을 느끼고 있다는 그는 이달 두 번째 작품을 탈고할 계획이다.제3회 시 부문 당선자 김민율 씨(37)는 등단 이전과 별다를 것 없어 보이는 일상을 보내고 있다. 하지만 그에게도 분명한 변화가 생겼다. “등단 전에는 좀 편안하게 시를 썼는데 등단한 뒤로는 책임감 있게 시를 쓰려고 한다”고 김씨는 말했다. “그래서 더 예민한 상태를 유지하려고 노력합니다. 시를 썼다는 데 만족하지 않고 이 시를 통해 무엇을 할 수 있을까 고민하고 있어요.”제2회 시 부문 당선자 이소연 씨(32)도 “작품을 쓴 사람은 읽는 사람보다 주제에 대해 더 깊이 생각할 수밖에 없다”며 “작품을 쓰면서 내 자신이 바뀌어가는 것을 느낀다”고 말했다.신인 작가를 발굴·육성하고 문화콘텐츠를 발굴하기 위한 한경 청년신춘문예가 4회를 맞았다. 제3회부터 만 39세 이하까지 참여할 수 있도록 폭을 넓혔다. 20대 대학생부터 작가의 꿈을 놓지 않은 30대 지망생에게까지 문이 열려 있다.올해는 시, 장편소설, 시나리오 등 세 개 부문에서 새로운 작가를 찾아 나선다. 장편소설 부문은 3000만원의 상금을 준다. 원고량은 200자 원고지 기준 1000장 안팎이며 10장 분량의 줄거리 설명을 따로 제출해야 한다. 시는 5편 이상 제출해야 하며, 시나리오 원고는 400장 안팎(시놉시스 10장 별도)이다. 시와 시나리오 상금은 500만원씩이다.원고는 A4 용지에 출력해서 보내야 한다. 응모작은 과거에 발표했거나 입상한 적이 없는 순수 창작물이어야 한다. 다른 공모전에 중복 투고해 이미 입상한 작품이거나 표절한 사실이 밝혀지면 당선을 취소한다. 봉투에 ‘한경 청년신춘문예 응모작품’이라 적고 작품 첫 장과 마지막 장에 응모 부문, 이름(필명일 경우 본명 병기), 주소, 전화번호, 원고량(200자 원고지 기준), 주민등록상 생년월일을 명시해야 정식 응모작으로 접수한다. 모든 원고는 반환하지 않는다.', |
|
|
'정부가 발표한 ‘9·1 부동산 대책’ 가운데 국회를 거쳐야 할 입법 사항을 두고 갈등이 불거지고 있다. 9·1 대책 대부분은 정부 차원에서 시행령이나 규칙을 고치면 시행할 수 있는 내용이지만, 여야 합의를 통해 국회 통과가 필요한 택지개발촉진법(택촉법) 폐지, 청약제도 개편 등을 두고 야당이 반발하고 나섰다. 서울시도 재건축·재개발 등 정비사업 방식 개편에 반대해 추진에 어려움을 겪을 것이라는 전망이 나온다.지난 1일 정부가 발표한 규제완화안 42개 가운데 법 개정이 필요한 입법 사항은 모두 11개다. 새정치민주연합은 이 가운데 △택촉법 폐지 △공공관리제 개선(도시 및 주거환경정비법) △청약제도 개편(주택법) 등에 반대하고 있다. “서민주거안정 방안이 아니라 서울 강남권 중심의 부동산 경기 부양 정책”이라는 주장이다.우선 택촉법을 폐지하면 더 이상 신도시급의 대규모 주택 공급을 할 수 없어 집값 상승 우려가 있다는 게 야당 측 지적이다. 백재현 새정치연합 정책위 수석부의장은 “상대적으로 집값이 싼 택지지구가 사라지면 무주택 서민이 집을 장만하기는 더 어려워질 것”이라고 말했다. 국토교통부 관계자는 이에 대해 “주택 보급률이 100%를 넘은 데다 최근 주택 공급과잉으로 이미 지정된 대형 택지지구 상당수를 해제하고 있는 실정”이라며 “신도시급 대신 중소형 규모의 도시개발은 계속 추진할 것”이라고 설명했다.청약 가점제를 지방자치단체장이 자율 운영하도록 한 것도 무주택자 혜택을 줄이는 방안이라는 주장이 나온다. 현재 청약제도는 무주택 기간이 오래되고 부양가족이 많은 세대주에게 가점을 주고 있다. 이를 지자체장 자율에 맡길 경우 무주택 혜택이 사라질 가능성이 높다는 지적이다. 국토부 관계자는 “청약 과열이 우려되는 투기과열지구와 공공주택지구에 대해서는 가점제를 의무 적용해 무주택 서민에게 우선 공급할 계획”이라고 해명했다.공공관리제를 개선하는 도정법은 서울시가 반대하고 있다. 개선안은 토지 등 소유자 과반수가 원할 경우 사업시행인가 이전에 시공사를 선정할 수 있도록 한다. 서울시 조례보다 상위법인 도정법이 개정되면 지자체는 이를 따라야 한다. 서울시 관계자는 “시공사 선정을 앞당길 경우 사업비가 높아지고 조합원 간 갈등이 늘어날 가능성도 있다”고 주장했다. 이현진/이호기/김병근 기자', |
|
|
'대전에 있는 선병원은 의료업계에선 ‘한류스타’로 통한다. 지난 4년간 이곳을 찾은 외국인 환자는 1만2000명이 넘는다. 2011년 854명에 불과했으나 지난해에는 5431명으로 급증했다. 이 기간 외국인 환자 증가율은 536%에 이른다.선병원은 국내외 병원들의 ‘벤치마킹’ 대상이다. 지금까지 이곳을 탐방하고 돌아간 국내 종합병원만 100곳에 이른다. 서울대병원과 삼성서울병원 등 내로라하는 종합병원들도 ‘자존심’을 내려놓고 선병원의 장점을 배우기 위해 찾고 있다.작년 한 해에만 일본·중국·러시아·베트남·태국·인도 등 해외 20여개국 의료기관들이 병원 경영을 배우러 왔다. 선병원은 넘치는 방문객들로 인해 업무에 지장을 받자 방문 가능한 날을 월 1회, 마지막주 금요일로 제한하기도 했다.선병원은 대전시내와 유성에 흩어져 있는 병상을 모두 합쳐야 900개 정도다. 규모로 보면 평범한 지방 종합병원이지만 각종 지표로 보면 성장세가 가파르다. 작년 말 기준으로 하루 외래 환자 수는 3500명 선이다. 외국인 환자 유치를 계기로 본격적인 변신을 시도한 4년 전과 비교하면 34.6% 증가한 것이다.서울에 있는 종합병원들에 비해 지리적으로 불리한 지방 병원이 ‘혁신의 아이콘’으로 불리는 비결은 무엇일까. 선승훈 의료원장은 “배울 수 있는 모든 것을 매뉴얼화한 결과”라고 설명했다. 선병원이 가장 심혈을 기울이는 것은 최고급 서비스를 벤치마킹하는 일이다. 선 원장은 “1년에 지구 네 바퀴 반을 돌면서 세계 각국의 혁신 사례를 모아 온다”고 했다. 그는 매년 한두 차례 직원 15~20명을 해외에 내보낸다. 그의 주문은 단 하나, “아무것도 생각하지 말고 최고급 서비스를 즐겨라”.혁신은 곳곳에서 이뤄졌다. 간호사들은 환자의 정보를 일일이 수첩에 적고 이를 전산으로 관리해 호평을 받고 있다. 4년 전 선 원장과 직원 20여명이 방문한 싱가포르 6성급 호텔인 카펠라호텔의 서비스에서 가져온 아이디어다. 상담직원들의 ‘발딱 응대’는 태국 방콕의 사미티벳 병원 간호사들이 의자에 앉아 있는 환자 가족 등과 눈높이를 맞추기 위해 무릎을 꿇는 것에서 배워왔다.싱가포르 창이국제공항, 홍콩국제공항 등도 ‘배움터’였다. 병원을 리모델링할 때 이용객 편의를 극대화한 국제공항의 동선을 적용했다.선병원은 지난달 중환자실을 5성급 호텔형으로 새로 꾸몄다. 중환자실 간호사들의 사무공간을 ‘펜타곤형’으로 정중앙에 배치, 환자들의 요구사항과 행동에 즉시 대응할 수 있도록 바꿨다. 별도 비용 없이 보호자가 환자 곁에서 머물 수 있도록 개별 침대와 욕실도 마련했다. 이규은 경영총괄원장은 “호텔의 장점을 접목한 중환자실을 갖추기 위해 신라호텔과 롯데호텔 등 국내 특급호텔은 물론 일본 벳푸 세이카이호텔, 홍콩 랑선플레이스 등 아시아 주요 호텔을 거의 빠짐없이 훑었다”고 전했다.', |
|
|
] |
|
|
) |
|
|
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...] |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
### Direct Usage (Transformers) |
|
|
|
|
|
<details><summary>Click to see the direct usage in Transformers</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Downstream Usage (Sentence Transformers) |
|
|
|
|
|
You can finetune this model on your own dataset. |
|
|
|
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
</details> |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Out-of-Scope Use |
|
|
|
|
|
*List how the model may foreseeably be misused and address what users ought not to do with the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Bias, Risks and Limitations |
|
|
|
|
|
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
### Recommendations |
|
|
|
|
|
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.* |
|
|
--> |
|
|
|
|
|
## Training Details |
|
|
|
|
|
### Training Dataset |
|
|
|
|
|
#### Unnamed Dataset |
|
|
|
|
|
* Size: 35,108 training samples |
|
|
* Columns: <code>sentence_0</code>, <code>sentence_1</code>, and <code>label</code> |
|
|
* Approximate statistics based on the first 1000 samples: |
|
|
| | sentence_0 | sentence_1 | label | |
|
|
|:--------|:-----------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------|:------------------------------------------------| |
|
|
| type | string | string | int | |
|
|
| details | <ul><li>min: 11 characters</li><li>mean: 29.18 characters</li><li>max: 66 characters</li></ul> | <ul><li>min: 504 characters</li><li>mean: 996.04 characters</li><li>max: 2044 characters</li></ul> | <ul><li>0: ~51.40%</li><li>1: ~48.60%</li></ul> | |
|
|
* Samples: |
|
|
| sentence_0 | sentence_1 | label | |
|
|
|:----------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------| |
|
|
| <code>선진국이 외국 기업을 대우하기 위한 제도는?</code> | <code>현오석 부총리 겸 기획재정부 장관이 중소기업 보호를 위해 공공조달 시장에서 ‘국내외 대기업에 대한 동등 규제’ 원칙을 밝힘에 따라 정부가 세부 규제 방안 마련에 들어갔다. 정부는 특히 이 같은 규제는 외국 기업만을 대상으로 한 규제와 달리 세계무역기구(WTO) 43개 가입국이 맺고 있는 정부조달협정(GPA)에 위배되지 않는다는 입장을 분명히 했다. ▶본지 11월11일자 A1, 3면 참고○정부, “공공시장 역차별 시정”기재부 관계자는 11일 “내부 검토 결과 국내 대기업과 외국 대기업을 동등하게 규제하는 것은 국제적으로 문제가 안 된다”며 “선진국도 세제 지원, 진입 장벽 설치, 재정 지원 등을 통해 자국 중소기업을 100% 보호하고 있다”고 말했다. 외국 기업을 차별 대우하면 문제가 되지만 그렇지 않으면 국제법상 문제가 없다는 것이다.이 관계자는 이어 “중소기업 보호를 위해 국내 대기업을 배제했는데 (국내 대기업보다 덩치가 큰) 외국계 대기업이 들어오는 건 문제가 있다는 점이 국정감사에서도 여러 번 지적됐다”며 “이런 현상을 방치할 수 없다는 게 정부 방침”이라고 강조했다. 일부에서 ‘외국계 대기업 규제가 국내 시장을 지키려다 해외 시장을 잃는 조치 아니냐’는 지적이 나오는 데 대해서도 “해외 시장 포기가 아니라 국내 기업이 받는 역차별 해소 차원”이라고 적극 반박했다. 중소기업을 위해 남겨둔 자리를 외국계 기업이 치고 들어오면 국내 대기업이 역차별을 받는 것은 물론 중소기업 사이에서도 ‘외국계 기업과 제휴를 하느냐 못하느냐’에 따라 공공조달 시장에서 차별을 받을 수 있다는 이유에서다. 기재부는 이에 따라 조만간 산업통상자원부 중소기업청 조달청 등 관계부처와 협의해 현 부총리가 밝힌 규제 방안을 다듬는 작업에 나서기로 했다. 기재부 내부적으로는 이미 지난주에 검토 작업을 한 차례 했다. 통상 주무부처인 산업부도 이미 내부적으로는 이 같은 국내외 동등 규제는 WTO 협정에 위배되지 않는다는 판단을 내렸다. 산업부의 관계자는 “중소기업 보호를 위한 예외 적용은 정...</code> | <code>1</code> | |
|
|
| <code>워렌이 스스로 영화를 제작할 수 있음을 입증하여 승부에서 이긴 상대는 누구인가?</code> | <code>“마노스: 운명의 손”은 워렌의 고향인 텍사스주 엘 파소에 있는 카프리 극장에서 1966년 11월 15일 시사회를 가졌다. 워렌은 시사회에 쓰려고 서치라이트를 구했으며 헐리우드 분위기를 내기 위해 캐스트가 탈 리무진을 대여했다. 하지만 리무진 한 대 밖에 대여가 안 되었으므로, 캐스트를 반으로 나누어 한 그룹을 시사회로 태우고, 다시 리무진을 돌려 기다리고 있던 나머지 그룹을 근처 모퉁이에서 태우고 시사회로 데려와야했다. 시사회에는 시장, 지역 보안관 등 지역의 주요 인사들이 다수 초대되었다. 영화가 시작한 지 얼마 지나지 않아, 시사회장은 웃음으로 가득찼다. 워렌과 나머지 출연진은 민망해진 채로 재빨리 출구를 통해 빠져나갔다. 시사회 후, 워렌은 자신이 보기에도 “마노스”가 최악의 영화라고 생각하지만 그래도 자랑스럽다고 밝혔다. 또한, 잘만 다듬으면 재밌는 코미디 영화로 만들 수 있을 것 같다는 얘기도 인터뷰에서 하였다<br><br>이 영화는 에머슨 사가 배포를 맡았다. 또한 카프리 극장에서 잠시 동안 상영되었으며, 텍사스 서부의 드라이브인 극장에서도 상영이 되었다. 어떤 보고에 따르면 작업의 대가를 받은 스탭은 잭키 니먼 존스와 그녀의 강아지 뿐이었으며, 그 대가도 자전거와 다량의 강아지 음식이었다고 하는데, 이는 영화가 재정적으로 얼마나 크게 실패했는지를 보여준다 공식 박스오피스 집계는 알려져있지 않다. 영화에 대한 반응은 좋지 않았으나, 워렌은 자신이 혼자 영화를 만들 수 있음을 증명하여, 스털링 실리펀트와의 내기에서 승리하였다</code> | <code>1</code> | |
|
|
| <code>장편소설 분야에 지원할 때, 작품 외에 별도로 써야 하는 글은 몇 장인가?</code> | <code>부산대 철학과에 다니는 홍준성 씨(24)는 지난해 가을 학생 신분으로 제3회 한경 청년신춘문예의 문을 두드렸다. 홍씨는 철학과 책을 좋아하는 평범한 학생이었다. 신춘문예 장편소설 부문에 당선되며 그의 삶은 변했다. 상금을 여비 삼아 전국을 여행하며 이야기를 수집했다. 강원 호남 영남 등 역사적 비극을 지닌 곳을 찾아다니며 이야기를 들었다. 당선 전까지만 해도 말하기를 좋아했던 젊은 청년은 어느새 타인의 말을 귀 기울여 듣는 젊은 작가로 변신했다. 홍씨는 올해 문학동네 작가상 본심에 이름을 올리는 등 신춘문예 당선이 우연이 아니었음을 증명해 나가고 있다. 그의 청년신춘문예 당선작 열등의 계보(은행나무)는 퇴고를 거듭해 이달 정식 출간된다.좋은 작품은 그것을 읽는 사람의 인생은 물론 만든 사람의 인생도 바꾼다. 가장 좋은 사례가 신춘문예다. 문학 지망생으로서 끝없는 습작의 나날을 보내던 이들은 신춘문예라는 관문을 거쳐 작가로 변신한다.제2회 장편소설 당선자인 김의경 씨(36)의 당선작 청춘파산(민음사)은 젊은 세대가 겪는 어려움을 솔직하게 표현해 호평받은 작품이다. 이 소설에는 김씨가 겪은 일들이 상당 부분 녹아 있다. 김씨는 집안이 어려워지는 바람에 어린 시절 해 보지 않은 아르바이트가 없을 정도였다.김씨는 지난 2월 한국문화예술위원회와 서울 프린스호텔이 후원하는 창작집필실 입주작가 프로그램에 선정돼 한 달 동안 호텔에서 집필에 전념했다. 호텔에서 펜을 잡자 대학생 시절 호텔 주방에서 설거지했던 기억이 떠올랐다. “호텔에서 글을 쓰니 옛날 생각이 나서 기분이 묘했어요. 호텔에서 일할 때는 정문으로 들어갈 수도 없는 신세였는데 말이죠.” 정식 작가가 된 뒤 더 큰 책임감을 느끼고 있다는 그는 이달 두 번째 작품을 탈고할 계획이다.제3회 시 부문 당선자 김민율 씨(37)는 등단 이전과 별다를 것 없어 보이는 일상을 보내고 있다. 하지만 그에게도 분명한 변화가 생겼다. “등단 전에는 좀 편안하게 시를 썼는데 등단한 뒤로는 책임감 있게 시를 쓰려고 한다”고 김씨는 말했...</code> | <code>1</code> | |
|
|
* Loss: [<code>BinaryCrossEntropyLoss</code>](https://sbert.net/docs/package_reference/cross_encoder/losses.html#binarycrossentropyloss) with these parameters: |
|
|
```json |
|
|
{ |
|
|
"activation_fn": "torch.nn.modules.linear.Identity", |
|
|
"pos_weight": null |
|
|
} |
|
|
``` |
|
|
|
|
|
### Training Hyperparameters |
|
|
#### Non-Default Hyperparameters |
|
|
|
|
|
- `per_device_train_batch_size`: 16 |
|
|
- `per_device_eval_batch_size`: 16 |
|
|
- `num_train_epochs`: 1 |
|
|
|
|
|
#### All Hyperparameters |
|
|
<details><summary>Click to expand</summary> |
|
|
|
|
|
- `overwrite_output_dir`: False |
|
|
- `do_predict`: False |
|
|
- `eval_strategy`: no |
|
|
- `prediction_loss_only`: True |
|
|
- `per_device_train_batch_size`: 16 |
|
|
- `per_device_eval_batch_size`: 16 |
|
|
- `per_gpu_train_batch_size`: None |
|
|
- `per_gpu_eval_batch_size`: None |
|
|
- `gradient_accumulation_steps`: 1 |
|
|
- `eval_accumulation_steps`: None |
|
|
- `torch_empty_cache_steps`: None |
|
|
- `learning_rate`: 5e-05 |
|
|
- `weight_decay`: 0.0 |
|
|
- `adam_beta1`: 0.9 |
|
|
- `adam_beta2`: 0.999 |
|
|
- `adam_epsilon`: 1e-08 |
|
|
- `max_grad_norm`: 1 |
|
|
- `num_train_epochs`: 1 |
|
|
- `max_steps`: -1 |
|
|
- `lr_scheduler_type`: linear |
|
|
- `lr_scheduler_kwargs`: {} |
|
|
- `warmup_ratio`: 0.0 |
|
|
- `warmup_steps`: 0 |
|
|
- `log_level`: passive |
|
|
- `log_level_replica`: warning |
|
|
- `log_on_each_node`: True |
|
|
- `logging_nan_inf_filter`: True |
|
|
- `save_safetensors`: True |
|
|
- `save_on_each_node`: False |
|
|
- `save_only_model`: False |
|
|
- `restore_callback_states_from_checkpoint`: False |
|
|
- `no_cuda`: False |
|
|
- `use_cpu`: False |
|
|
- `use_mps_device`: False |
|
|
- `seed`: 42 |
|
|
- `data_seed`: None |
|
|
- `jit_mode_eval`: False |
|
|
- `use_ipex`: False |
|
|
- `bf16`: False |
|
|
- `fp16`: False |
|
|
- `fp16_opt_level`: O1 |
|
|
- `half_precision_backend`: auto |
|
|
- `bf16_full_eval`: False |
|
|
- `fp16_full_eval`: False |
|
|
- `tf32`: None |
|
|
- `local_rank`: 0 |
|
|
- `ddp_backend`: None |
|
|
- `tpu_num_cores`: None |
|
|
- `tpu_metrics_debug`: False |
|
|
- `debug`: [] |
|
|
- `dataloader_drop_last`: False |
|
|
- `dataloader_num_workers`: 0 |
|
|
- `dataloader_prefetch_factor`: None |
|
|
- `past_index`: -1 |
|
|
- `disable_tqdm`: False |
|
|
- `remove_unused_columns`: True |
|
|
- `label_names`: None |
|
|
- `load_best_model_at_end`: False |
|
|
- `ignore_data_skip`: False |
|
|
- `fsdp`: [] |
|
|
- `fsdp_min_num_params`: 0 |
|
|
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} |
|
|
- `fsdp_transformer_layer_cls_to_wrap`: None |
|
|
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} |
|
|
- `parallelism_config`: None |
|
|
- `deepspeed`: None |
|
|
- `label_smoothing_factor`: 0.0 |
|
|
- `optim`: adamw_torch_fused |
|
|
- `optim_args`: None |
|
|
- `adafactor`: False |
|
|
- `group_by_length`: False |
|
|
- `length_column_name`: length |
|
|
- `ddp_find_unused_parameters`: None |
|
|
- `ddp_bucket_cap_mb`: None |
|
|
- `ddp_broadcast_buffers`: False |
|
|
- `dataloader_pin_memory`: True |
|
|
- `dataloader_persistent_workers`: False |
|
|
- `skip_memory_metrics`: True |
|
|
- `use_legacy_prediction_loop`: False |
|
|
- `push_to_hub`: False |
|
|
- `resume_from_checkpoint`: None |
|
|
- `hub_model_id`: None |
|
|
- `hub_strategy`: every_save |
|
|
- `hub_private_repo`: None |
|
|
- `hub_always_push`: False |
|
|
- `hub_revision`: None |
|
|
- `gradient_checkpointing`: False |
|
|
- `gradient_checkpointing_kwargs`: None |
|
|
- `include_inputs_for_metrics`: False |
|
|
- `include_for_metrics`: [] |
|
|
- `eval_do_concat_batches`: True |
|
|
- `fp16_backend`: auto |
|
|
- `push_to_hub_model_id`: None |
|
|
- `push_to_hub_organization`: None |
|
|
- `mp_parameters`: |
|
|
- `auto_find_batch_size`: False |
|
|
- `full_determinism`: False |
|
|
- `torchdynamo`: None |
|
|
- `ray_scope`: last |
|
|
- `ddp_timeout`: 1800 |
|
|
- `torch_compile`: False |
|
|
- `torch_compile_backend`: None |
|
|
- `torch_compile_mode`: None |
|
|
- `include_tokens_per_second`: False |
|
|
- `include_num_input_tokens_seen`: False |
|
|
- `neftune_noise_alpha`: None |
|
|
- `optim_target_modules`: None |
|
|
- `batch_eval_metrics`: False |
|
|
- `eval_on_start`: False |
|
|
- `use_liger_kernel`: False |
|
|
- `liger_kernel_config`: None |
|
|
- `eval_use_gather_object`: False |
|
|
- `average_tokens_across_devices`: False |
|
|
- `prompts`: None |
|
|
- `batch_sampler`: batch_sampler |
|
|
- `multi_dataset_batch_sampler`: proportional |
|
|
- `router_mapping`: {} |
|
|
- `learning_rate_mapping`: {} |
|
|
|
|
|
</details> |
|
|
|
|
|
### Training Logs |
|
|
| Epoch | Step | Training Loss | |
|
|
|:------:|:----:|:-------------:| |
|
|
| 0.2278 | 500 | 0.2381 | |
|
|
| 0.4556 | 1000 | 0.072 | |
|
|
| 0.6834 | 1500 | 0.0639 | |
|
|
| 0.9112 | 2000 | 0.0494 | |
|
|
|
|
|
|
|
|
### Framework Versions |
|
|
- Python: 3.12.11 |
|
|
- Sentence Transformers: 5.1.0 |
|
|
- Transformers: 4.56.1 |
|
|
- PyTorch: 2.8.0+cu126 |
|
|
- Accelerate: 1.10.1 |
|
|
- Datasets: 4.0.0 |
|
|
- Tokenizers: 0.22.0 |
|
|
|
|
|
## Citation |
|
|
|
|
|
### BibTeX |
|
|
|
|
|
#### Sentence Transformers |
|
|
```bibtex |
|
|
@inproceedings{reimers-2019-sentence-bert, |
|
|
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", |
|
|
author = "Reimers, Nils and Gurevych, Iryna", |
|
|
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", |
|
|
month = "11", |
|
|
year = "2019", |
|
|
publisher = "Association for Computational Linguistics", |
|
|
url = "https://arxiv.org/abs/1908.10084", |
|
|
} |
|
|
``` |
|
|
|
|
|
<!-- |
|
|
## Glossary |
|
|
|
|
|
*Clearly define terms in order to be accessible across audiences.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Authors |
|
|
|
|
|
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.* |
|
|
--> |
|
|
|
|
|
<!-- |
|
|
## Model Card Contact |
|
|
|
|
|
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.* |
|
|
--> |