SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
| Label |
Examples |
| 4.0 |
- '천년거북온구기(점화식)+진영감생명쑥봉80+터보라이터 세진메디칼약품(주)'
- '가정용 왕쑥봉 말린쑥 약숙 쑥가루 주전부리 김진수'
- '[NF81261]압봉- 기황 은6호 한국메디칼'
|
| 9.0 |
- '고려수지침 서암출혈침관 사혈기 세트 침100개 알콜100매 한방종합'
- 'KM침 1통(100쌈 1000개) 일회용침 알콜솜 20매 멸균 스프링침 소독 0.40x60 주식회사 에이치이바이오'
- 'TG 서암봉1호/6호 금색 5박스 04. 6호 금색 5박스 '
|
| 14.0 |
- '올바스 오일 칠드런 12ml 대용량 3. 올바스오일 오리지널 30ml 바이트랜스'
- '꿀잠꿀잠 입벌림 방지 마우스 밴드(25매)-3개 메디팩토리'
- '힐조 유칼립투스 민트밤 25g 단품 구매_유칼립투스 민트밤 30g (2개이상 무료배송) 힐조'
|
| 12.0 |
- '헬베이프 젤로 맥스 팟 공팟 0.6옴 메쉬팟(낱개1개) 전자담배 전담 코일 카트리지 디어베이프'
- '몬스터펀치 전자담배액상 전담액상 완성형 알로에베라 무니코틴 워리어컴퍼니'
- '국내배송 아이코스3 캡, 홀더 (아이코스 듀오 호환) 메가트랜디패션'
|
| 5.0 |
- '마스클립 마스크 안쪽까지 보호하는 마스크스트랩 화이트그레이 주식회사 아이리스'
- '아에르 넥밴드 10종 (택1) 실리콘 넥스트랩 마스크줄 국산 CS-NB_PIN 넥 밴드 (핑크) 1개 해밀컴퍼니 주식회사'
- '카론슨 고급 마스크 스트랩 목걸이 03.밀리터리카키 핑셀링(PINGSELLING)'
|
| 8.0 |
- '휴족시간 신형 6매 x 3팩 발패치 다리 종아리 쿨링시트 일본히트 건강스토어'
- '휴족시간 쿨링시트 6매입 x 5개 (주)씨제이이엔엠'
- '휴족시간 쿨링시트 6매입 x 5개 / 다리관리 패치 쿨링패치 7.온감테라피 온열 발바닥밴드 4매입x2개 jullia2222'
|
| 16.0 |
- '베리메디 파라핀 왁스 레몬 453g, 12개 슈어트레이드'
- '왁싱워머기 제모용 고급 업소용 왁싱워머 셀프 왁스 오렌지 핸드 왁스 1조각 (450g) 헬로구쯔'
- '파라핀 보온 장갑 찜질 보습 보호 덮개 가정용 장갑 052640DC 대상컴퍼니'
|
| 6.0 |
- '찐마스크 KFAD 대형 50입 화이트 [내추럴키스 찐마스크] KFAD대형화이트50입개별포장 주식회사 웹이즈'
- '식약처 의약외품 수술용 수성 덴탈마스크 백색 50매 엠알오샵'
- '아이바나리 KF94 마스크 새부리형마스크 컬러 10매 MS_코튼아이보리 주식회사 라온브라더스'
|
| 13.0 |
- '손가락마사지기 손가락지압기 지압구슬 손가락롤러 로즈의하루'
- '손가락 지압기 혈자리 합곡혈 지압봉 블랙 365랜드1'
- '손 가락 핸드 마사지 지압 맛사지 안마 기 손가락 마사지 롤러 에스더블유컴퍼니'
|
| 3.0 |
- '대장검사키트 분변잠혈검사 이지디텍트 용종선종 3매 대장검사키트 X 4매 (주)대지인팜'
- '메디위 셀프 이지디텍트 대장검사지/간편2분/초기 대장암 자가진단/용종 검사 주식회사 소연'
- '청폐88 수동식흉벽진동기 목 가래 제거기 배출기 객담 유도기 호흡 재활 폐활량 운동기 1_연두색(불투명) 케이비스토어'
|
| 1.0 |
- '페이버 R300B 스포츠팔찌 3줄타입 핸드메이드 야구 용품 남자 여자 R300B-08_XL 버들버들RYU'
- '게르마늄 스포츠팔찌 음이온 밸런스 밴드 검은색 S사이즈 르보'
- '건강팔찌 게르마늄팔찌 순도 회복 피로 99 남성용 로즈 골드 (올 블랙 게르마늄) 나의선물'
|
| 10.0 |
- '마스케어 메탈 투명 위생 마스크 식당 주방 주방용 음식점 메탈_1개입 (주)코스모스웨이'
- '마스케어 메탈 투명 위생 마스크 식당 주방 주방용 음식점 에코_5개입 (주)코스모스웨이'
- '마스케어 메탈 투명 위생 마스크 식당 주방 주방용 음식점 메탈_5개입 (주)코스모스웨이'
|
| 2.0 |
- '아로마 금연 파이프 니코틴 없는 비타 스틱 피우는 비타민 담배 대체 복만두닷컴'
- '금연보조제 금연파이프 약국 니코틴 패치 배출 금연초 약 영맨'
- '담배대신 피우는 약국 비타민 담배 파이프 아그얼라'
|
| 0.0 |
- '호무로 겨울용 먼지없는 고급 차렵이불 단품 SS Q K SK(당일출고) 크림_슈퍼킹 SK 범퍼카타요'
- '펜던트 보관 효도 약목걸이 목걸이 BW5BA3C5 골드_협심증N 하니스토어16'
- '토네이도목걸이 마라톤 ex와이어 건강 러닝 스포츠 야구jkl493 EX와이어토네이도목걸이핑크-화이트43cm 샵프리G'
|
| 15.0 |
- 'NS 발포세척정 50정 세척제 코세척기 텀블러 물병 틀니 음식기 조리기 살균 세정제 NS세척정(50정) 메디파인'
- '노즈스위퍼 코세척기(분말10포)+분말100포set/코세정 MinSellAmount 메디파인'
- '눈가습기 환절기 비강 코건조 치료 콧구멍 스팀기 G. 50ml 용량 + 드라이 아이팩 5팩 하늘'
|
| 11.0 |
- '액상 전자담배 오리지널 Yocan Flat Plus 배터리 베이프 펜 900mAh 510 스레드 10s 예열 C타입 08ohm 카트리지 전자 담배 Black_3pcs 톱켓'
- '전자담배 무화기 폐호흡 교체 아크릴 천둥 패널 커버 Cthulhu AIO 박스 모드 액세서리 01 WHITE 특별한하루직구'
- '요요 멜로망스 입호흡 전자담배 액상 러브피치 퐁당스'
|
| 7.0 |
- '예스이어 소음방지 이어플러그 수면귀마개 층간 차단 수영 NS4000 FI3000 TI5000 [제품2]NS4000_오렌지 예스이어본사'
- '실리콘귀덮개 염색용귀보호커버 파마용귀마개 리테일파크'
- '맥스 소음방지 귀마개 대용량 소프트폼 드림걸 100개입 코 골이 소음차단 수면 이어플러그 울트라 100개입 (주)에버셀'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_lh0")
preds = model("부푸 브이메이트맥스 액상입호흡입문전자담배 오닉스블랙 토이베이프")
Training Details
Training Set Metrics
| Training set |
Min |
Median |
Max |
| Word count |
3 |
10.4659 |
31 |
| Label |
Training Sample Count |
| 0.0 |
50 |
| 1.0 |
50 |
| 2.0 |
25 |
| 3.0 |
50 |
| 4.0 |
50 |
| 5.0 |
50 |
| 6.0 |
50 |
| 7.0 |
50 |
| 8.0 |
50 |
| 9.0 |
50 |
| 10.0 |
28 |
| 11.0 |
50 |
| 12.0 |
24 |
| 13.0 |
50 |
| 14.0 |
50 |
| 15.0 |
50 |
| 16.0 |
50 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
| Epoch |
Step |
Training Loss |
Validation Loss |
| 0.0082 |
1 |
0.4305 |
- |
| 0.4098 |
50 |
0.347 |
- |
| 0.8197 |
100 |
0.1694 |
- |
| 1.2295 |
150 |
0.0708 |
- |
| 1.6393 |
200 |
0.0363 |
- |
| 2.0492 |
250 |
0.0314 |
- |
| 2.4590 |
300 |
0.0411 |
- |
| 2.8689 |
350 |
0.0414 |
- |
| 3.2787 |
400 |
0.0175 |
- |
| 3.6885 |
450 |
0.0267 |
- |
| 4.0984 |
500 |
0.0184 |
- |
| 4.5082 |
550 |
0.0085 |
- |
| 4.9180 |
600 |
0.0185 |
- |
| 5.3279 |
650 |
0.0094 |
- |
| 5.7377 |
700 |
0.0022 |
- |
| 6.1475 |
750 |
0.0078 |
- |
| 6.5574 |
800 |
0.0104 |
- |
| 6.9672 |
850 |
0.004 |
- |
| 7.3770 |
900 |
0.0081 |
- |
| 7.7869 |
950 |
0.0058 |
- |
| 8.1967 |
1000 |
0.0045 |
- |
| 8.6066 |
1050 |
0.0021 |
- |
| 9.0164 |
1100 |
0.0079 |
- |
| 9.4262 |
1150 |
0.0021 |
- |
| 9.8361 |
1200 |
0.0002 |
- |
| 10.2459 |
1250 |
0.0001 |
- |
| 10.6557 |
1300 |
0.0001 |
- |
| 11.0656 |
1350 |
0.0001 |
- |
| 11.4754 |
1400 |
0.002 |
- |
| 11.8852 |
1450 |
0.0002 |
- |
| 12.2951 |
1500 |
0.0039 |
- |
| 12.7049 |
1550 |
0.0001 |
- |
| 13.1148 |
1600 |
0.0001 |
- |
| 13.5246 |
1650 |
0.002 |
- |
| 13.9344 |
1700 |
0.0005 |
- |
| 14.3443 |
1750 |
0.0002 |
- |
| 14.7541 |
1800 |
0.0001 |
- |
| 15.1639 |
1850 |
0.0001 |
- |
| 15.5738 |
1900 |
0.0001 |
- |
| 15.9836 |
1950 |
0.0001 |
- |
| 16.3934 |
2000 |
0.0001 |
- |
| 16.8033 |
2050 |
0.0001 |
- |
| 17.2131 |
2100 |
0.0001 |
- |
| 17.6230 |
2150 |
0.0001 |
- |
| 18.0328 |
2200 |
0.0001 |
- |
| 18.4426 |
2250 |
0.0001 |
- |
| 18.8525 |
2300 |
0.0001 |
- |
| 19.2623 |
2350 |
0.0 |
- |
| 19.6721 |
2400 |
0.0001 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}