SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
| Label |
Examples |
| 10.0 |
- '캐리어바퀴 여행용 휠 교체 수리 수선 무소음 51종 49. W358 페어 오리지널리티'
- '교체 수리 부품 범용 호환 캐스터 여행 캐리어바퀴 15.O(상세페이지 참조) 아라가나고야도이길'
- '해외가방 교체부품 액세서리 손잡이 캐리어 수리 핸들 여행용 수하물 핸들링 범용 28호 손잡이(1개) 루디프몰'
|
| 8.0 |
- '십자형 캐리어 벨트 투웨이 고정 트렁크 밴드 여행 가방 보호 잠금 오렌지 도비77마켓'
- 'TCUBE - 멀티 안전케이블 + 4다이얼 안전자물쇠 세트 - 2.5M[티큐브] 블루 주식회사 웹이즈'
- '정확도 다용도 도난방지 락 자전거열쇠 바이크열쇠 오토바이열쇠 코베유통'
|
| 1.0 |
- '캐리어 네임택 러기지택 여행 가방 네임 표시 이름표 태그 플라스틱 케이블 스트랩 6. 그린 우동방구'
- '홀로그램 피오피 네임택 골프 배드민턴 볼링 축구 야구 태권도 탁구 테니스 등산 콘서트명찰 9cm_양면_검정 플라스틱 그레이브러시'
- '[마넷] 마넷 실리콘 러기지택 4종 04. 버니슈 (주) 교보문고'
|
| 6.0 |
- '레츠백 플라커 세면백 LB405TBNG 블랙 갓블레스'
- '언더아머 핸드백 1361993-001 UA 컨테인 트레블 키트 1361993-001_1 주식회사 비비엘유이코리아'
- '세면백 여행용워시백 투명 방수 세면도구파우치 워시백 블랙(M) 최민준'
|
| 5.0 |
- '씨투써밋 트래블 월렛 RFID SM 여행 여권 목걸이 지갑 11203586 SM 하이라이즈 더블유컴퍼니'
- '월레스와 그로밋 여권 케이스 지갑 커버 가족 네이비 핫핑크_one size 폰브로스'
- '[캐스키드슨] 패스포트 홀더 씨사이드 쉘 (CK-A105347216662102) (주)스타럭스'
|
| 9.0 |
- '[맨백] 대용량 캐리어 대형 36인치 여행용 케리어 ELG456L 32인치_라이트블루 맨백스토어'
- '아메리칸투어리스터TREPPE PLUS 트레페 플러스 여행가방 5종 세트 색상:아이언 레드 GSSHOPTV'
- '30% 스카이코브 25인치 다크섀도우 GE407005BCDS 다크섀도우_46 31 69 NC_백화점'
|
| 4.0 |
- '빈티지 슈트 케이스 레트로 엔틱 가방 촬영 소품 고전 브라운A 페트라클라우드'
- '빈티지 슈트 케이스 레트로 엔틱 가방 촬영 소품 고전 브라운B 페트라클라우드'
- '[시후레] 초경량 프레임 가방 ZEROGRA 제로그라 ZER1143 74 cm 5.1 kg 매트 블랙 YSPlanning'
|
| 0.0 |
- '(NS홈쇼핑) 트래커 마카론 여행가방 2종 SET(캐리어+미니크로스백) 31889386 바나나옐로우 신세계몰'
- 'PESPES. 루키 레디백 12형 커스터드 옐로우 [0001]단일상품 CJONSTYLE'
- '정식수입품 에어휠 전동캐리어 블랙핑크실버 최고급 프리미엄 모델 SE3S 프리미엄_핑크 한미그린산업(주)'
|
| 7.0 |
- '롤리키드 저소음 2단 이민가방 RLP9IG2 [0002]버건디 CJONSTYLE'
- '캐리어 타입 블랙 초대형 소프트 여행가방 이민가방 ~32인치 H_큰 한경리'
- '100인치 특대 여행가방 초대형 수하물캐리어 한달살기 이민 C_80 인치 워너직구'
|
| 11.0 |
- '캐릭터 스판 캐리어 커버 여행용 캐리어 보호커버 가방보호 06.쿠마몬_L 오에스케이(On Sale Korea)'
- '스판 무지 캐리어커버 20인치 방수 30인치 24인치 28인치 케리어 덮개 블루_XL 헬로쁘미'
- '[꿀트립] 스판/방수 캐리어커버 (HFTR) 06.베리마블_S(TRAE23L-S) 호자인터내셔널'
|
| 3.0 |
- '허리 수납 밴드 복대 여행용 가방 힙색 지갑 그레이:M 쏭리빙'
- 'LEA-L1300 멀티여행백 연보라 와플플러스 주식회사'
- '허리힙색 여권복대 여행보조백 폰가방 스포츠전대 검정 추가C'
|
| 2.0 |
- '방수 여행 용 보스턴백 백팩 가방 캠핑 구 숄더백 쇼퍼백 커플 블랙 서승솔루션'
- '레스포삭 라지 트래블백 방수 토트 크로스백 대용량 4319 블랙 블랙 스누피 쿼카상점'
- '갤러리아 헤리티지 카고 백 라이트 NN2FP78A (BLK) - NN2FP78 검정_one size/free 갤러리아백화점'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_ac11")
preds = model("보호 M사이즈 캐리어보호커버 캐리어 스판덱스 커버 TRC805M 위드위너(g)")
Training Details
Training Set Metrics
| Training set |
Min |
Median |
Max |
| Word count |
3 |
10.4117 |
23 |
| Label |
Training Sample Count |
| 0.0 |
50 |
| 1.0 |
50 |
| 2.0 |
50 |
| 3.0 |
50 |
| 4.0 |
50 |
| 5.0 |
50 |
| 6.0 |
50 |
| 7.0 |
50 |
| 8.0 |
50 |
| 9.0 |
50 |
| 10.0 |
50 |
| 11.0 |
50 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
| Epoch |
Step |
Training Loss |
Validation Loss |
| 0.0106 |
1 |
0.3558 |
- |
| 0.5319 |
50 |
0.2892 |
- |
| 1.0638 |
100 |
0.136 |
- |
| 1.5957 |
150 |
0.075 |
- |
| 2.1277 |
200 |
0.0462 |
- |
| 2.6596 |
250 |
0.0302 |
- |
| 3.1915 |
300 |
0.0165 |
- |
| 3.7234 |
350 |
0.0173 |
- |
| 4.2553 |
400 |
0.0096 |
- |
| 4.7872 |
450 |
0.0156 |
- |
| 5.3191 |
500 |
0.004 |
- |
| 5.8511 |
550 |
0.0002 |
- |
| 6.3830 |
600 |
0.0001 |
- |
| 6.9149 |
650 |
0.0001 |
- |
| 7.4468 |
700 |
0.0001 |
- |
| 7.9787 |
750 |
0.0001 |
- |
| 8.5106 |
800 |
0.0001 |
- |
| 9.0426 |
850 |
0.0001 |
- |
| 9.5745 |
900 |
0.0001 |
- |
| 10.1064 |
950 |
0.0001 |
- |
| 10.6383 |
1000 |
0.0001 |
- |
| 11.1702 |
1050 |
0.0001 |
- |
| 11.7021 |
1100 |
0.0 |
- |
| 12.2340 |
1150 |
0.0001 |
- |
| 12.7660 |
1200 |
0.0001 |
- |
| 13.2979 |
1250 |
0.0 |
- |
| 13.8298 |
1300 |
0.0 |
- |
| 14.3617 |
1350 |
0.0001 |
- |
| 14.8936 |
1400 |
0.0 |
- |
| 15.4255 |
1450 |
0.0 |
- |
| 15.9574 |
1500 |
0.0001 |
- |
| 16.4894 |
1550 |
0.0 |
- |
| 17.0213 |
1600 |
0.0001 |
- |
| 17.5532 |
1650 |
0.0 |
- |
| 18.0851 |
1700 |
0.0 |
- |
| 18.6170 |
1750 |
0.0 |
- |
| 19.1489 |
1800 |
0.0 |
- |
| 19.6809 |
1850 |
0.0 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}