SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
| Label |
Examples |
| 5.0 |
- '(LMG 택티컬) BFE 파우치 OD 대신장비샵'
- '퍼프디노 그린가스 블랙 파워가스 600ml 12kg 검펍디 리버티라이프(Liberty Life)'
- '아카데미과학 전동권총 데저트이글 L6 비비탄권총 자동 에어소프트건 비비탄총 09. 한국군 K5 오마이컴퍼니'
|
| 4.0 |
- 'DJI 네오 / 납품 세금계산서 가능 주식회사 모즈인터내셔날'
- 'DJI Air 3 Fly More Combo (DJI RC-N2 포함) 게이트비젼(주)'
- 'DJI AIR 3S 에어 3S 플라이 모어 콤보 (RC2)납품 세금계산서가능 주식회사 모즈인터내셔날'
|
| 10.0 |
- '해적안대 가죽 할로윈용품 파티 의상소품 장식 데코 홈피스트'
- '특수분장 할로윈 더마왁스상처재료 가짜피 인조피100ml BMmall'
- '해적안대 가죽 할로윈 용품 파티 의상소품 데이 에스지'
|
| 3.0 |
- '디디샵 지우개 야광 당근 나이프 (주)라온러닝'
- '반다이 정품 RG 가오가이거 선물의 목적'
- '주사모형 정맥 주입 근육 훈련 팔 모델 간호사 혈액 손 모형 팔뚝 정맥 천자 재킷 싹슬'
|
| 12.0 |
- '소량 포스터 출력 인쇄 / 4종류 종이 / A3(420 297) 단면 아트지90g A3(420×297)_양면_스노우지 250g 킹콩카피'
- '6090포스터 모음 W-3. 지구지도 포스터 한글 - 블루2 주식회사 제로퍼제로'
- '천 포스터 가리개 장식 행잉 크리스마스 벽 트리 패브릭 인테리어 소품 5. 전나무 130X150 성공한 스토어'
|
| 2.0 |
- '비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 투명 비즈아이'
- '스쿠비두 룰라끈 매듭 공예 키링 스쿠비드 1m 낱줄 운동화끈-빨강 꾀조은'
- '비즈아이 [4925-13]글라스통과형 도트트리 15x16mm,1개 그린 비즈아이'
|
| 1.0 |
- '최고급 메탈 피젯 핑거 스피너 야광 무소음 연속 회전 1_01_오렌지 sf103 사찌몰'
- '5초 준다 MinSellAmount 스마일배송'
- '5초 준다 주식회사 보드엠'
|
| 8.0 |
- '빈티지 도장 스탬프 헤드 카드 봉투 청첩장 선물 포장 18.1588971 14.1588966 써니타운몰15호점'
- '킵탑 자동차 유아용 보조 카시트 방석 커버 보호매트 삼촌쇼핑몰'
- '오렌지오피스 스카이보람 우표 수집 앨범 리필내지 전지 우표 5단 리필 오렌지 오피스'
|
| 7.0 |
- '세븐틴 응원봉 SEVENTEEN OFFICIAL LIGHT STICK VER.3 (새제품) 조우코리아'
- 'IVE 아이브 응원봉 키링 오후세시반'
- '아이브 얼빡샷 포카 포토카드 옵션선택 배디 키치홀리데이'
|
| 11.0 |
- '직소퍼즐 주문제작 커플 여행 기념일 선물 사진 퍼즐액자 제작 A5-(80피스)_추가안함_세로 투미투'
- '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_19.온천욕-150 예그린스페이스'
- '짱구는못말려 소풍 100피스 만화 캐릭터 직소퍼즐 [ 짱구는못말려 150 피스 ]_03.디비전-150 예그린스페이스'
|
| 0.0 |
- '봇치 더 락 록 굿즈 결속 밴드 아날로그 LP 바이닐 한정판 일본 직구 기본 다락방'
- '2LP 게이트폴드 비닐 컷팅 32cm 10장 2LP 게이트폴드 비닐 컷팅 32cm 10장 포린(porin)'
- '잭 브라이언 The Great American Bar Scene 바이닐 LP 앨범 음반 엘라커넥티드'
|
| 13.0 |
- '전문가 동전 수집 코인 케이스 보관 종이 홀더 50장 코인홀더 종이홀더 수집홀더 37mm 더비씨디'
- '개업 연말 이벤트 답례 축하 선물 행운의 2달러 포함 액자 행운의2달러 액자 주식회사 투마이니'
- '비트코인 기념주화 모형 장식 3종 골드 에스에이치에너지'
|
| 6.0 |
- '유니콘 입체 그림 인테리어 소품 액자 유니콘 그림 1번지 스토어'
- '서예용품 단아미 고급서예붓18mm 화방 화방용 화선지 글로벌케이마켓'
- '16절고무판(20입)문구 교재류 준비물 판화교재 남생몰'
|
| 9.0 |
- '파니니 NBA카드 탑클래스 KBL 농구카드 1박스 르브론제임스 스테판커리 이정현 허웅 허훈 월드스포츠카드서울신도림점'
- '원피스 루피 조로 캐릭터 굿즈 트럼프카드 유캔매직샵'
- '고전키티 과일키티 스트랩 오타쿠 다락방'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_lh15")
preds = model("3D 토이나이프 야광 당근칼 틱톡 나이프 피젯 장난감 칼 미니검 3연발 다트권총(핑크) 또와토이")
Training Details
Training Set Metrics
| Training set |
Min |
Median |
Max |
| Word count |
3 |
10.9546 |
25 |
| Label |
Training Sample Count |
| 0.0 |
50 |
| 1.0 |
50 |
| 2.0 |
50 |
| 3.0 |
50 |
| 4.0 |
48 |
| 5.0 |
50 |
| 6.0 |
38 |
| 7.0 |
50 |
| 8.0 |
50 |
| 9.0 |
25 |
| 10.0 |
50 |
| 11.0 |
50 |
| 12.0 |
50 |
| 13.0 |
50 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
| Epoch |
Step |
Training Loss |
Validation Loss |
| 0.0096 |
1 |
0.4054 |
- |
| 0.4808 |
50 |
0.3432 |
- |
| 0.9615 |
100 |
0.2163 |
- |
| 1.4423 |
150 |
0.0533 |
- |
| 1.9231 |
200 |
0.0368 |
- |
| 2.4038 |
250 |
0.0235 |
- |
| 2.8846 |
300 |
0.0308 |
- |
| 3.3654 |
350 |
0.0158 |
- |
| 3.8462 |
400 |
0.0122 |
- |
| 4.3269 |
450 |
0.0117 |
- |
| 4.8077 |
500 |
0.0041 |
- |
| 5.2885 |
550 |
0.004 |
- |
| 5.7692 |
600 |
0.006 |
- |
| 6.25 |
650 |
0.0096 |
- |
| 6.7308 |
700 |
0.004 |
- |
| 7.2115 |
750 |
0.0002 |
- |
| 7.6923 |
800 |
0.0002 |
- |
| 8.1731 |
850 |
0.0001 |
- |
| 8.6538 |
900 |
0.0001 |
- |
| 9.1346 |
950 |
0.0001 |
- |
| 9.6154 |
1000 |
0.0001 |
- |
| 10.0962 |
1050 |
0.0001 |
- |
| 10.5769 |
1100 |
0.0001 |
- |
| 11.0577 |
1150 |
0.0001 |
- |
| 11.5385 |
1200 |
0.0 |
- |
| 12.0192 |
1250 |
0.0001 |
- |
| 12.5 |
1300 |
0.0001 |
- |
| 12.9808 |
1350 |
0.0001 |
- |
| 13.4615 |
1400 |
0.0001 |
- |
| 13.9423 |
1450 |
0.0 |
- |
| 14.4231 |
1500 |
0.0 |
- |
| 14.9038 |
1550 |
0.0 |
- |
| 15.3846 |
1600 |
0.0 |
- |
| 15.8654 |
1650 |
0.0 |
- |
| 16.3462 |
1700 |
0.0001 |
- |
| 16.8269 |
1750 |
0.0 |
- |
| 17.3077 |
1800 |
0.0 |
- |
| 17.7885 |
1850 |
0.0 |
- |
| 18.2692 |
1900 |
0.0 |
- |
| 18.75 |
1950 |
0.0 |
- |
| 19.2308 |
2000 |
0.0 |
- |
| 19.7115 |
2050 |
0.0001 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}