aewol-embedding-v1 / README.md
JHyeok5's picture
Upload folder using huggingface_hub
76405dc verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - dense
  - generated_from_trainer
  - dataset_size:6238
  - loss:TripletLoss
base_model: juyoungml/bge-m3-ko-v1.1
widget:
  - source_sentence: 영등할망은 누구이며 어떤 일화가 전해지나요?
    sentences:
      - >-
        , 손귀현 순경 등 2명이 전사, 6명이 부상당했다. (제3장 제4절 옛비석 에서 비문을 기록함) 최근에는 마을 주민들이 숙원
        사업 중 하나로 파출소의 이전을 요구하고 있다. 다. 마을 방호 성담쌓기 제2절 마을행정과 현대사 220 4·3을 극복하기 위한
        고육지책의 방안으로 산의 무장대 야간습격을 저 지하기 위해 온 마을 사람들이 동원 되어 마을 주위를 석성으로 쌓았는 데,
        동쪽으로는 구 고등학교의 동쪽 울타리를 기준으로 동광동을 안쪽으 로 남쪽으로는 원당거리 아래 지금의 새로난 소방도로를 기준으로
        대추낭 밭을 안쪽으로 서쪽으로는 뒷동산 서 쪽을 기준으로 좁은질을 성담의 안쪽으로 쌓았다. 통로의 문을 3개소를 두어 마을 청년들
        이 번(番)을 보며 지켰다. 동문은 지금 보건소 앞 동산위에 있었고 남문은 잡피막거리와 원 당거리 중간, 남문동네의 제일 남쪽집
        바로 남쪽에 있었으며 서문은 내고향 주유소 근처에 일주도로에 있었다. 성담은 높이 4m 너비 1m의 잡석으로 쌓아 성 밖엔
        가시나무(국가시나 무, 구지뽕나무)들을 대량으로 깔아 사람이 접근할 수 없도록 하고 장정들로 하여금 수시 순 찰을 돌도록 하였다.
        (1948. 11. 5일 발령된 계엄포고령에 해안에서 5km이상 산간으로 갔 을 때는 무장대와 내통자로 간주 무차별 사살 또는
        검거한다) 성문마다 보초막을 설치해 밤마다 장정들로 하여금 순번을 정하여 지키도록 했다. 보초막 은 약 7~8평으로 초가지붕과
        돌집으로 지었으며 안에는 흙벽과 약 40㎝정도의 기단을, 시 설 흙바닥을 만들어 그 위에다 보릿짚을 깔았다.
      - "84. 3. 1.~1987. 8. 31.24대박종일 2020. 3. 1.~ 2022. 8. 31. 12대양경호1987. 9. 1.~1990. 8. 31.25대강순구 2022. 9. 1.~ 현재 13대이명준1990. 9. 1.~1993. 2. 28. 제4장 교육과 문학 교 가 481 5. 유아교육 가. 애월초등학교 병설유치원 1) 원훈 바르게\x1A슬기롭게\x1A튼튼하게 원아 중심의 질 높은 교육과정\x1A환경을 제공하는 유치원 교직원의 자율과 책무성을 존중하는 유치원 스스로 생각하고 해결하는 창의적 능력을 향상시키는 유치원 꿈과 사랑을 키우는 행복한 유치원 꿈을 키우는 어린이 ▪서로를 배려하고 존중하 는 어린이 ▪모든 활동에 적극적으로 참여 하고 스스로 생각하 여 해결하는 어린이 ▪몸이 건강하고 마음이 행 복한 어린이 ▪아이들과 눈을 맞추는 친 절한 교사 ▪사랑과 열정을 다하여 가 르치는 교사 ▪믿음과 사랑으로 기다릴 줄 아는 교사 ▪믿음과 존중으로 기다릴 줄 아는 학부모 ▪좋은 본을 보이는 학부모 ▪내 아이만이 아닌 모든 아이들을 사랑해주는 학 부모 사랑을 실천하는 교사 소통하고 함께하는 학부모 원 훈 창의성 교육과 인성 교육 제1절 교육 482 2) 교육목표 교 육 중 점중점 실천 내용 1. 유아 · 놀이중심 의 교육과정 운영 가. 2019 개정 누리과정 및 유치원 여건과 지역특성을 반영한 단위 유치원 교육과정 편성 나. 유아의 발달단계를 고려한 유아교육과정 운영 다. 유아가 느끼고 체험할 수 있는 놀이위주의 교육활동 라. 실천 중심의 창의·인성교육 강화 마. 다양한 평가 방법으로 교육과정 운영의 내실화 바."
      - >-
        야곡 조극선 은 “입춘이면 대궐에서 민가에 이르기까지 춘첩자를 붙여 복을 기원하는데, 신하로서 임금 의 복을 빈다면 괜찮지만
        자신의 복을 비는 것은 허망한 짓”이라고 비판하였다. 민가의 대 문을 마주 보고 오른쪽에 ‘입춘대길(立春大吉,입춘이니 대단히
        길하고)’, 왼쪽에 ‘건양다경 (建陽多慶,봄이오니 경사가 많다)’이라고 써 붙이는 것이 보통이며, 다른 경우에는 ‘수여산
        부여해(壽如山富如海, 산처럼장수하고 바다처럼 부유하다)’라고도 쓴다. (동국세시기) 또는 건양다경 대신에
        ‘만사형통(萬事亨通,모든일이 잘 풀린다)’이라고 쓰는 경우가 대부 분이다. 2. 2월 첫 조금, 곧 간조(干潮) 때 바다가
        잔잔하면 그 해에 해산물을 풍성하게 거둘 수 있으며, 스무날에 바다가 잔잔하면 농사가 잘 된다고 한다. 가. 연등절, 영등절,
        연등제, 연등굿, 영등굿 제1절 세시(歲時)풍속 562 영등신은 해산물의 풍요를 가져오는 바다와 바람의 신이다. 옛날에 제주
        어부의 배가 심한 풍랑에 휩쓸려 사람을 잡아먹는다는 외눈박이 거인들이 사 는 섬으로 가는 것을 영등할망이 순풍을 불어 구해주었다.
        이 일로 외눈박이 거인들은 영등 을 잡아다 세 토막을 낸 뒤 바다에 내던졌다. 영등의 어머니 바다는 딸을 파도에 실어 제주로
        보냈다. 영등의 신체는 여러 곳에서 찢겨 진 채 발견이 되었는데, 머리는 협재, 몸뚱이는 명월, 손발은 고내와 애월에서
        발견되었다고 한다. 제주 어부들은 자신들 때문에 죽은 영등을 알아보고 넋을 기리며 굿을 벌였다.
  - source_sentence: 제주도 주민들의 국장 준비 과정에 대해 알고 싶습니다. 나무 분배와 상납에 대한 주민들의 의견은 어떠한지 궁금합니다.
    sentences:
      - "메모를 보면, 1930년경부터 목포, 진도, 관도, 추자도, 등지와 교역 1. 상굿배(장삿배) 풍선 2척 2. 군대환(제주~대판) 1,000톤 정기 취항 3. 어선 5~6척 4. 교역물품 - 수출품 : 목화(면화) / 수입품 : 쌀, 생활용품, 기타 옹기 등 애월~목포 93마일(160km) / 제주~목포 96마일(178km) 약 20km차 제7장 산업 767 본격적인 개발 1971년 12월 : 제1종항으로 지정된 이후부터 일제때 하던 방파제 축조 시작(어항규모로) 1995년 12월 : 연안항으로 승격(제주항 보조항 설계) 현재 기존방파제 상태에서(어항기준) 항내에 물 양장(선착장) 시설을 해 놓은 상태 서쪽에 235m, 동쪽에 334m, 어선물양장 290m 항내수심 : 평균 4.5m 항내면적 : 211 평방 접안능력 : 6 척(1,000 톤급) 선박입출항 : 600여 척 물량 : 80만 톤(시설은 200만 톤) 입 733,000 톤, 출 160 톤 ≪한라일보≫ 1996년 1월 3일자 기사를 보면, \x1A애월 항은 연안항으로 신규 지정되어 해운항만청으로 운영 권이 넘어옴에 따라 향후 항만 개발이 본격화 되게 됐 다\x1A고 보도하고 있다. 본격적인 개발이 시행되면서 내항 도로 확장공사도 아울러 진행되었다. 제2절 수산업 768 (1996년 11월 10일 촬영 ; 애월항개발 추진 위원회 자료) 1996년 ≪제주일보≫의 기사를 보면, 제 주지방 해운항만청은 연안항으로 지정된 애 월항에 대한 항만 공사를 착수키로하고 예산 확충 작업에 필요한 설계 용역 마무리 및 기 본공사를 시작한다고 밝혔다."
      - >-
        하여 장사를 치렀다. 정부에서는 고인의 공훈을 기리어 1982년 독립유공 대통령 표창을, 또 1990년 8월 15일 건국훈장
        애국장을 추서하였다.
      - >-
        國葬). 인봉(因封). 414 에 분배했고, 이 진 또한 저희 9개 마을에 다시 분배를 한 바, (이제) 상납(上納)할 때가 시급
        한 까닭에 우선 산에 올라가 베어놓긴 하였습니다. 하지만 대체로 온 섬 자체가 다 균등하게 왕의 백성인 즉 이치상 한 몸이 되어
        함께 수고하는 게 당연한데, 신우면(新右面) 20개 마을 〔洞〕 가운데 어찌 유독 저희 ‘9개 마을’에만 일방적 책임을 지우는
        것입니까? 또한 재작년 에 ‘무위소(武衛所)에서 하달했던 이년목(二年木)·창병목(槍柄木)·가시목(加時木) 등은 ’사 실상 별도의
        진상‘이기 때문에 ’모든 면민(面民)이 일체가 되어 역에 응하라’는 뜻으로 전 사 또가 제김[題音]을 내렸던 일도 (아직) 해와
        별처럼 환한데도, 이제 인산에 소용되는 나무야 말로 무위소의 것과 비교하면 어찌 갑절은 더 귀중하지 않겠습니까? 따라서 일제히
        엎드려 바라는 바, 무위소에 상납했던 사례와 똑같이 여기시고, 면(面)의 ‘모든 백성’들에게 골고루 분배시켜 (나무를) 끌어
        옮기게 해서 저희로 하여금 나랏일에 혼자 짊어지는 수고로움을 한 탄하지 말도록 해 주십시오.
  - source_sentence: 애월항 개발의 역사와 변화를 보여주는 사진들은 어디에서 찾아볼  있나요?
    sentences:
      - >-
        시행령이 개정, 공포됨에 따라 애월항 은 연안항으로 신규 지정되었다. 2009년 07월 21일 제주 LNG 인수기지로 애월항이
        결정 되었다. 그 간의 변화를 사진으로 나열하였다. 1967.10.7.촬영 항공사진(국토지리정보원) 1969.2.12.촬영
        항공사진(국토지리정보원) 1979.10.15.촬영 항공사진(국토지리정보원) 1985.9.12.촬영 항공사진(국토지리정보원) 제2절
        수산업 764 1990.5.25.촬영 항공사진(국토지리정보원) 1995.10.9.촬영 항공사진(국토지리정보원)
        2003.10.30.촬영 항공사진(국토지리정보원) 2008.10.11.촬영 항공사진(국토지리정보원) 2010.11.13.촬영
        항공사진(국토지리정보원) 2013년 카카오지도 2018년 카카오지도 제7장 산업 765 1) 애월항개발추진위원회 구성 1995년
        12월 당시 1종어항이었던 애월항은 연안항으로 승격된 후, 개발위원회에서는 계속 하여 애월항의 개발을 촉구하기에 이른다. 이에
        개발위원회에서는 애월항개발추진위원회를 구성하고 김관진을 위원장으로 추대하여 개발에 박차를 기하기 시작하였다. 1996.2.5.
        당시 (이장 박도천, 개발위원장 강성웅) 개발회의록을 보면, 애월항개발 추진위 원회를 결성하자는 의견에 동의하고 이장과
        개발위원장이 추천위원 명단을 구상하여 발표 한다.
      - >-
        집이 들어서면서 우선은 마당을 중심으로 안거리 그리고 밖거리 외 중요하게 다룬 것은 눌굽과 헛간 그리고 통시를 뒀다. 1)
        이문간(대문) 이문간이 있는 집은 그리 많지는 않았다. 주로 길가 올래가 있는 집에 있었으며 길과 마당 이 맞닿은 집은 길을
        차단키 위한 오직 길가 대문만 있는 집도 있었다. 또한 이문간의 이문(출입대문)은 주로 3간 밖거리에 두거나 아니면 별도 목거리에
        두고 출입토록 하는 경우도 있었으며 이문간에 주로 쇠왕(외양간)을 위치시켰다. 제6장 의식주, 생활용구 689 2) 마당 집의
        중심이다. 마당은 생활공간이며 사면팔방의 통로인 한편 생산 공간[타작, 불림질, 엮 음질, 날래(건조)]이며 집안으로 통풍과 채광
        역할 등을 돕는 최적의 공간이다. 뿐만 아니라 모든 경조사등 큰일을 치르기 위한 행사장이었다. 3) 장항 뒤 육지처럼 장독대를
        앞마당에 놓지를 아니했다. 왜냐하면 우리 제주의 마당은 생산을 위한 공간으로 활용되기에 자칫하면 장독이 다칠 우려가 있어 장독은
        유독 뒷 우녕 옆 아니면 옆 우녕 한쪽에다 위치시켰다. 무속 신앙으로 뒷할망 즉 칠성신을 모시는 집은 장항 뒤 주쟁이 (띠로 엮어
        만든 3각형의 모형으로 눌 제일 꼭대기에다 씌우는 덮개)를 설치해 놓고 정성을 들이는 집도 있었다. 4) 물팡 물팡은 물허벅을
        올려놓는 곳이다. 수도가 없던 시절 에 허벅은 중요한 생활도구였다. 편리하게 이용할 수 있 는 시설인 물팡은 그래서 부엌출입문
        가까이에 있을수 록 좋았다.
      - >-
        월 31일 2학년제 부설 공진학교는 1923년 9월에 설립하여 1927년 3월에 폐지되었고, 부설과는 1924년 1 월 6일에
        수업을 개시하여 1927년 3월 19일에 폐지되었다. 공진학교의 설립일과 부설과의 수업개시 시기는 차이가 있지만 폐지 시기가 둘
        다 1927년 3월인 것으로 보았을 때 공진학 교와 부설과는 동일한 것으로 생각된다. 『연혁지』주요 행사에는 단기
        4257년(1924년) 3 23 「교육법시행령」 [시행 1952. 4. 23.] [대통령령 제633호, 1952. 4. 23.,
        제정] 제70조 ‘학교의 학기는 다음과 같이 두 학기로 나눈 다. 제1학기 4월 1일부터 9월 30일까지 제2학기 10월 1일부터
        익년 3월 31일까지’, <https://www.law.go.kr/법령/교육법시행령/ (00633,19520423)> 24
        「교육법」[시행 1962. 3. 1.] [법률 제680호, 1961. 8. 12., 일부개정] 부칙 ‘①본법은 단기
        4295연도(1952년도)의 학년초부터 시 행한다. ②단기 4294연도(1951년도)의 학년은 단기 4295년(1952년) 2월
        말일에 끝난다.’ <https://www.law.go.kr/법령/교육법/ (00680,19610812)> 제4장 교육과 문학
        445 월 30일 부설과 제1회 졸업식, 단기 4258년(1925년) 3월 23일 부설과 제2회 졸업식, 4259년 (1926년)
        3월 23일 부설과 제3회 졸업식이 거행되었다고 되었다고 기재되어 있다.
  - source_sentence: 이웃에서 지내다 보니  생태를  알게  현상이 무엇인가요?
    sentences:
      - >-
        이야기를 하다 보니, 어느 마누라 죽었느냐고 반문할 정도면, 마의동풍이나 다를 것이 없다. 바로 그와 같은 현상을 두고 일컫는
        말이다.
      - 인의 공훈을 기리어 1995 건국훈장 애족장을 추서하였다.
      - 왼지 못해 보이는 현상이다. 이웃에서 지내다 보니,  생태를 빤히 알게 됨으로써 별로 신통해 보이지 않기 때문이다.
  - source_sentence: 제주 항일운동가 손실 소식에 대해 알고 싶습니다.
    sentences:
      - >-
        다. 항일ㆍ노동운동의 거목이 손실되자 조선인ㆍ일본인의 노동계가 합동으로 시신을 유리관(棺)에 안치, 오사카시 노동장(勞動葬)으로
        성대히 엄수... (내용이 길어 일부 생략됨)
      - >-
        30일 국회 본회의는 각 지역의 양민 학살 진상조사특위의 지방 출장을 승인 결의할 때 김두진(金斗珍:북제주) 의원이 등단, 조사
        대상 지역에 제주를 포함시켜 줄 것을 제의하였다. 동년 6월 1일 제주도 지역의 조사를 경남ㆍ제주반(慶南ㆍ濟州班)이 담당키로
        결정되자 특별위원장 최천(崔天:민주당), 동 위원 조일재(趙一載:민주당), 박상길(朴相吉:자유당) 등이 조사차 내도, 유족 대표인
        장갑순(張甲順:하귀), 4ㆍ3 사건 진상규명 동지회의 고순화(順華), 제주신문사 전무 신두방, 문영백(文永伯:신엄),
        김평중(金坪重), 도의회 의장 강영술(姜榮述), 장석관(張錫瓘) 등이 증인으로 채택되었다.
      - 머리가 되는 것이 아니다. 누구가 먼저 키를 잡는 수완과 자질을 발휘해 선점하느냐에 따라 도사공의 지위를 차지하게 된다는 말이다.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
model-index:
  - name: SentenceTransformer based on juyoungml/bge-m3-ko-v1.1
    results:
      - task:
          type: triplet
          name: Triplet
        dataset:
          name: val
          type: val
        metrics:
          - type: cosine_accuracy
            value: 0.4135446548461914
            name: Cosine Accuracy

SentenceTransformer based on juyoungml/bge-m3-ko-v1.1

This is a sentence-transformers model finetuned from juyoungml/bge-m3-ko-v1.1. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: juyoungml/bge-m3-ko-v1.1
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    '제주 항일운동가 손실 소식에 대해 알고 싶습니다.',
    '다. 항일ㆍ노동운동의 거목이 손실되자 조선인ㆍ일본인의 노동계가 합동으로 시신을 유리관(棺)에 안치, 오사카시 노동장(勞動葬)으로 성대히 엄수... (내용이 길어 일부 생략됨)',
    '머리가 되는 것이 아니다. 누구가 먼저 키를 잡는 수완과 자질을 발휘해 선점하느냐에 따라 도사공의 지위를 차지하게 된다는 말이다.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[ 1.0000, -0.9309, -0.9304],
#         [-0.9309,  1.0000,  0.9989],
#         [-0.9304,  0.9989,  1.0000]])

Evaluation

Metrics

Triplet

Metric Value
cosine_accuracy 0.4135

Training Details

Training Dataset

Unnamed Dataset

  • Size: 6,238 training samples
  • Columns: sentence_0, sentence_1, and sentence_2
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 sentence_2
    type string string string
    details
    • min: 8 tokens
    • mean: 20.85 tokens
    • max: 91 tokens
    • min: 8 tokens
    • mean: 216.35 tokens
    • max: 2850 tokens
    • min: 6 tokens
    • mean: 193.04 tokens
    • max: 2850 tokens
  • Samples:
    sentence_0 sentence_1 sentence_2
    할머니, 할아버지는 어떤 모습일까요? [삼 서끈 할망은 놀레 불르곡, 노 서끈 하르방은 운다.]
    삼 섞은 할머니는 노래 부르고, 노 섞은 할아버지는 운다. 여자는 인내력과 서둘지 않은 차분한 일 처리 능력이 남자에 비해서 앞선다는 말이다.
    정부에서는 고인의 공훈을 기리어 1990년 광복절에 건국훈장 애족장을 추서하였다.
    제주도에서는 밥 먹는 일이 일과 어떤 연관이 있나요? 하고 다음 일을 할 수 있다. 어느 한 쪽이 늦어지면 그만큼 다음 일 착수가 늦어질 뿐만 아리나 일 처리도 미뤄지므로, 밥 먹는 일 자체가 곧 일을 차리는 것이 된다는 말이다.
    의미: 밥 먹음도 일 차림이다. 밥을 먹는 일은 평상시 정례화 된 사실이지만, 먹는 쪽이나 그 식사를 마련하는 쪽이 다 정해진 일과의 한 과정을 수행하고 있는 것이다. 그러니 먹는 사람은 먹어야 다음 일을 시작할 수 있고, 식사를 차려놓는 사람은 제 때에 먹어 버려야 뒤처리를 하고 다음 일을 할 수 있다. 어느 한 쪽이 늦어지면 그만큼 다음 일 착수가 늦어질 뿐만 아리나 일 처리도 미뤄지므로, 밥 먹는 일 자체가 곧 일을 차리는 것이 된다는 말이다.
    나하고 둘이 둥실 사랑하자.`
    행원남당본풀이 이야기 들어보고 싶습니다. [행원남당본풀이]
    (myth)
    [신화] MYTH2.002 - 핵심어: 본풀이,행원남당본풀이
    못하고 몸만 상하고 마는 현상을 지적하고 있다
  • Loss: TripletLoss with these parameters:
    {
        "distance_metric": "TripletDistanceMetric.EUCLIDEAN",
        "triplet_margin": 5
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 1
  • per_device_eval_batch_size: 1
  • fp16: True
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 1
  • per_device_eval_batch_size: 1
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • project: huggingface
  • trackio_space_id: trackio
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: no
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: True
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss val_cosine_accuracy
0.0802 500 4.8733 0.4135

Framework Versions

  • Python: 3.12.12
  • Sentence Transformers: 5.2.0
  • Transformers: 4.57.3
  • PyTorch: 2.9.0+cu126
  • Accelerate: 1.12.0
  • Datasets: 4.0.0
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

TripletLoss

@misc{hermans2017defense,
    title={In Defense of the Triplet Loss for Person Re-Identification},
    author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
    year={2017},
    eprint={1703.07737},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}