SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
| Label |
Examples |
| 1 |
- '보만 대용량 1단 LED터치 핸디 스팀다리미 DB8640G 바이 마르코 (by MARCO)'
- '[구매확정시 N포인트 5% 적립]필립스 핸디형 스팀다리미 7000시리즈 STH7030/18 베르수니코리아 주식회사'
- '테팔 클래시컬 플러스 논슬립 초경량 건식다리미 FS3120K0 주식회사 코스니크'
|
| 4 |
- '보풀제거기 세탁소용 FX-200 유선 아이프리 옷 제거 보푸라기 이불 FX-200 교체용 6중칼날 플라이비(FLY BEE)'
- '[IFREE] 아이프리 6중날 보풀제거기 FX-814 주식회사 더루츠'
- 'NEW 아이프리 세탁소 보풀제거기 가디건 니트 옷 FX-714 (주)클릭나라'
|
| 16 |
- '번개표 신형 넉다운 KKD-2200 세트 + 램프1개 추가 (총 램프 2개) KKD-2200 최신형+램프 1개 세트 (주)강남대흥'
- 'CAS 카스 360도 절루가 야생동물퇴치기 고라니 멧돼지 두더지 뱀 조류 퇴치기 CLAR-100 (주)지오쇼핑'
- '[스마토] 벅킬러 CF-BK06(블랙) 캠핑/벌레퇴치기/해충/모기 포에버툴'
|
| 14 |
- 'Coms 전화선 꼬임방지 White/NT874/전화선정리 [KF] 주식회사 케이에프컴퍼니'
- '전화선 꼬임방지 White/NT874/전화선정리 주식회사 지엔비커뮤니케이션즈'
- '지엔텔 GS-872 2라인(국선) 사무용전화기/단축메모리(12개)/재다이얼/온후크/벨음 리버앤오빌 주식회사'
|
| 11 |
- '지니큐 다용도 UV-C 살균 소독기 무선 자외선 살균기 스마트폰 마스크 UV-500ST 블랙 주식회사 한국전산오피스'
- '텔로 UV 살균기 미니 자외선 소독기 휴대용 책 멸균기 UVCLED 변기 멸균 TUV10 (주)모닝아트'
- "휴대용 마스크 살균소독기 유비세이프 C'Shell MLS-100 그레이 주식회사 유비세이프"
|
| 3 |
- '[잘텍] JX-220 ,JX220 생활무전기 1대 풀세트 블랙 플림스텔레콤주식회사'
- '민영 MYT-0033 MYT0033 고성능 생활무전기 정품이어마이크 3개 주식회사 오토플렉스'
- 'PD508/PD-508/무전기 용 경호용 이어마이크/리시버/국산/JM8000T 클럽데님'
|
| 13 |
- '바이마르 바디 건조기 드라이어 VMK-21A30D030 전신 에어 샤워 냉온풍 빠르고 깔끔한 건조 터치 스마트센서 드라이기 자동 몸말리는기계 욕실 따뜻한 시원한 바람 임산부 집들이 바이마르 바디 건조기 VMK-21A30D030 팬텀파트너스'
- '제크롤 바디 스킨 케어 에어샤워 전신건조기 JK-1WBD101 바디드라이어 (주)세중통상'
- '대림도비도스 바디건조기 DLB-700W 국내생산 바디 드라이어 DLB-700W (주) 더수바스'
|
| 15 |
- '다이슨 국내 정품 옴니 글라이드 컴플리트 (퍼플/니켈) 정품스텐딩거치대 포함 이루 이루 스토어'
- '로보락 다이애드 브러쉬 거치대 세트 팅크웨어모바일 주식회사'
- 'JCP 에브리봇 EDGE 주식회사 제이씨엠컴퍼니'
|
| 6 |
- '한국타올기산업 자동 손소독기계 HTM-620 자동 1개 (주)서브원'
- '티에스 자바코리아 자동 손소독기 THS2500T 전기식 건전지식 겸용 아름상사몰'
- 'HDTOP 비접촉 휴대용 자동 디스펜서 스프레이 손소독기 HT-A600 YGPJ-NJ0042 윤 미디어'
|
| 2 |
- '베스틴 지문방지 푸시풀 도어락 IDL-300 블랙헤어라인 2WAY 현관 아파트 도어락 블랙 유광 (IDL-300SWNK) 키넷'
- '셀프시공 삼성 IOT 푸시풀 디지털도어락 SHP-DR700+보강판 현관문 현관문도어락 하우스플러스(주)'
- '무료설치 에버넷 샷시문도어락 상가번호키 패션문도어록 가마찌도어샤시 EN250-N A지역무료설치 진흥피닉스(주)'
|
| 9 |
- '[하이마트] LG 스타일러 오브제컬렉션 S3BOF [3벌/미스트베이지] 롯데하이마트(주)'
- '엘지 트롬 스타일러 린넨 블랙 S3BF 의류관리 코스트코 갱이점빵'
- '[삼성] 에어드레서 상의 5
9 벌 + 하의 1 벌,코타차콜 DF24CG5100HR 배송은 주문 후 24주이상 소요 주식회사 위링크'
|
| 5 |
- '신일 스텐 탈수기 SDM-T77H 가정용 수영장 캠핑장 펜션 콜드림'
- '삼성전자 아가사랑 WA30T2101EE 동의 선우에이치앤비(SUNWOO H&B)'
- '한일전기 W-110 미니 짤순이 다용도 음식물 야채 오이지 두부 탈수기 1kg 탈수기 짤순이(신형) (주)씨앤제이글로벌'
|
| 12 |
- '싱거 8280(단품+수강증+보증서1년)+ 프리모션노루발+노루발3종+말아박이 랍바세트 태양에스엠주식회사'
- '부라더미싱 이노비스A16 (Innovis-A16) NV-A16 부라더미싱'
- '부라더미싱 이노비스 A80, innovis a80, 브라더미싱 팀에이에이 Team AA'
|
| 7 |
- 'LED스탠드 브로드윙X (LSP-9700) 베이스 화이트 멜라토닌 학습용 학생 스탠드 MinSellAmount (주)프리즘'
- '듀플렉스 DP-910LS 시력보호 면조명 LED 스탠드 책상 학생용 코지인터내셔널'
- 'LED스탠드 책상 학생 독서등 학습용 스텐드 NXL-3000 /스마일배송 오트빌'
|
| 0 |
- '스마트소닉 1000 음파칫솔 단품 [화이트] + 칫솔모 1팩 블루 에스에이치 인터내셔날'
- '프리쉐 PA-TS3000 골프_위탁 업체로 공급사나 배달업체에 개인정보 동의 도라에몽상회'
- '알로코리아 덴픽션 바람건조 고온히팅 UV-C 무선 휴대용 칫솔살균기 ATS1G 단품 1+1 세트_크림+블루 알로이비즈 주식회사'
|
| 17 |
- '[아메리칸스탠다드] 핸드 드라이어 삽입형 FG8901(고속형), FG8984(일반형) 화장실 상업용 편의품 FG8901(고속형) 대일도기사 주식회사'
- '대림 도비도스 DX-1000,DX1000 핸드드라이어 (아이보리) 준트레이딩(JUN Trading)'
- 'TS자바 핸드드라이어 TH350ST 스테인레스 핸드드라이기 TSJAVA 화장실 강풍 프럼바디'
|
| 8 |
- '쿠쿠 버블클렌저 연수기 CWS-AO201W 주식회사 제이홀딩스'
- '프렐 연수기 마이크로버블 클렌저 녹물 염소 제거 버블수기 무광 화이트 그레이 투톤색상 (주)로보터스'
- '[렌탈] [셀프형] 현대큐밍 샤워기필터 연수기 더클린 워터케어 (HQS20100W0) 실버 (주)현대렌탈케어'
|
| 10 |
- '[특별 ] 세라젬 밸런스 알칼리 이온수 생성기 의료기기 (주) 세라젬'
- '뉴랜드올네이처 알칼리이온수기 셀터치프리미엄 뉴랜드올네이처비전'
- '뉴랜드올네이처 알칼리이온수기 셀터치필터 복합중공사(UF Membrane) 뉴랜드올네이처비전'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_el11")
preds = model("ALLNEW29000 파워메이드_그레이(GRAY) 나성민")
Training Details
Training Set Metrics
| Training set |
Min |
Median |
Max |
| Word count |
3 |
9.3700 |
32 |
| Label |
Training Sample Count |
| 0 |
50 |
| 1 |
50 |
| 2 |
50 |
| 3 |
50 |
| 4 |
50 |
| 5 |
50 |
| 6 |
50 |
| 7 |
50 |
| 8 |
5 |
| 9 |
50 |
| 10 |
3 |
| 11 |
50 |
| 12 |
50 |
| 13 |
50 |
| 14 |
50 |
| 15 |
50 |
| 16 |
50 |
| 17 |
50 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
| Epoch |
Step |
Training Loss |
Validation Loss |
| 0.0079 |
1 |
0.4968 |
- |
| 0.3937 |
50 |
0.3206 |
- |
| 0.7874 |
100 |
0.1406 |
- |
| 1.1811 |
150 |
0.0735 |
- |
| 1.5748 |
200 |
0.0518 |
- |
| 1.9685 |
250 |
0.0242 |
- |
| 2.3622 |
300 |
0.006 |
- |
| 2.7559 |
350 |
0.0102 |
- |
| 3.1496 |
400 |
0.0088 |
- |
| 3.5433 |
450 |
0.0082 |
- |
| 3.9370 |
500 |
0.0062 |
- |
| 4.3307 |
550 |
0.012 |
- |
| 4.7244 |
600 |
0.0021 |
- |
| 5.1181 |
650 |
0.002 |
- |
| 5.5118 |
700 |
0.0049 |
- |
| 5.9055 |
750 |
0.0043 |
- |
| 6.2992 |
800 |
0.006 |
- |
| 6.6929 |
850 |
0.0002 |
- |
| 7.0866 |
900 |
0.0004 |
- |
| 7.4803 |
950 |
0.0002 |
- |
| 7.8740 |
1000 |
0.0002 |
- |
| 8.2677 |
1050 |
0.0002 |
- |
| 8.6614 |
1100 |
0.0001 |
- |
| 9.0551 |
1150 |
0.0001 |
- |
| 9.4488 |
1200 |
0.0002 |
- |
| 9.8425 |
1250 |
0.0002 |
- |
| 10.2362 |
1300 |
0.0001 |
- |
| 10.6299 |
1350 |
0.0001 |
- |
| 11.0236 |
1400 |
0.0001 |
- |
| 11.4173 |
1450 |
0.0001 |
- |
| 11.8110 |
1500 |
0.0001 |
- |
| 12.2047 |
1550 |
0.0001 |
- |
| 12.5984 |
1600 |
0.0001 |
- |
| 12.9921 |
1650 |
0.0001 |
- |
| 13.3858 |
1700 |
0.0001 |
- |
| 13.7795 |
1750 |
0.0001 |
- |
| 14.1732 |
1800 |
0.0001 |
- |
| 14.5669 |
1850 |
0.0001 |
- |
| 14.9606 |
1900 |
0.0001 |
- |
| 15.3543 |
1950 |
0.0001 |
- |
| 15.7480 |
2000 |
0.0001 |
- |
| 16.1417 |
2050 |
0.0001 |
- |
| 16.5354 |
2100 |
0.0001 |
- |
| 16.9291 |
2150 |
0.0001 |
- |
| 17.3228 |
2200 |
0.0001 |
- |
| 17.7165 |
2250 |
0.0001 |
- |
| 18.1102 |
2300 |
0.0001 |
- |
| 18.5039 |
2350 |
0.0001 |
- |
| 18.8976 |
2400 |
0.0001 |
- |
| 19.2913 |
2450 |
0.0001 |
- |
| 19.6850 |
2500 |
0.0001 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}