SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
| Label |
Examples |
| 2 |
- '셰퍼 스왈로우 핸디 청소기 JSK-N3009 주식회사 알앤피코스메틱'
- '마이아 듀얼프로 에어건 무선 청소기 ND-MYA001W 박진희'
- '신일 싸이클론 무선 청소기 SVC-D500SR 헤파필터 회전브러쉬 제이씨유통'
|
| 1 |
- 'LG전자 코드제로 R5 로봇청소기 R585WKA1 (카밍 베이지) 엠제이테크'
- 'LG 코드제로 R5 R585WKA 로봇청소기 흡입 + 물걸레 / KN (주)케이엔디지털'
|
| 8 |
- '(전용) 한경희 무선청소기 HCV-B400 PRO 전용 클린타워 모터 보호 헤파필터 '
- '삼성 정품 VS20B957F5E 청소기 헤드 흡입구 브러쉬 슬림 sava03291 H에이치마켓'
- '[별제이]일렉트로룩스 청소기 호환용 먼지봉투 10매 S-BAG ZUS4065AF 호환용 먼지봉투 10매 신세계몰'
|
| 5 |
- '디월트 20V 충전 스틱 전동 무선 청소기 차량용 세차용 집진기 DCV501LN 주식회사 신한비앤아이'
- '디월트 집진기 충전 청소기 무선 세차기 차량용 스틱 업소용청소기 DCV501LN 본체만 라이프 공구'
- '디월트 20V MAX 충전 스틱 집진 청소기 DCV501LN 01.DCV501LN 충전청소기 베어툴 한경툴 주식회사'
|
| 9 |
- '[신제품] 70도 열풍 진드기 제거 침구청소기 레이캅 코리아 '
- '[신제품] 70도 열풍 진드기 제거 침구청소기 레이캅 코리아 '
- '비쎌 스팟클린 하이드로 스팀 3791S 습식 스팀청소기 빈대퇴치 고온 살균 소파얼룩제거 BISSEL '
|
| 7 |
- '[런칭기념 보관가방 ] 클링봇S 물분사 가성비 창문청소로봇 유리창 창문 베란다 로봇청소기 '
- '에코백스 윈봇 W1S 창문 로봇청소기 에코백스공식스토어'
- '클링봇S 물분사 창문로봇청소기 원조 창문 청소기 보관가방포함 아이뮤즈본사'
|
| 0 |
- 'AVA 프리미엄 고압세척기 휴대용 가정용 고압세차기 AVA GO P55 동양테크툴'
- 'AVA 프리미엄 고압세척기 휴대용 가정용 고압세차기 아바 GO P55 에이지에스'
|
| 6 |
- '신일 유선 싸이클론 진공청소기 SVC-R700LOT 레드 + 블랙_SVC-R700LOT 스위트코코'
- '신일전자 유선 싸이클론 진공청소기 강력한흡입 HEPA필터 700W SVC-R700LOT 신창전자'
- '이스타 먼지제로 유선 진공 청소기 핸디스틱 소형 원룸 가정용 ESK-WV400 주식회사 제이에스엘홀딩스'
|
| 4 |
- '한경희 2in1 스팀청소기 HTE-S600 핸디스팀 LTE-S600 (주)에디샵'
- '[2024년 최신형] 리빈치 초고속 예열 고온 살균 스팀청소기 LSC-200 리빈치 스팀청소기 + 추가패드 증정 총 4장 (주)바투네트워크'
|
| 3 |
- 'KAC-5000(유선형)/오토비스/자동물걸레청소기/국산정품/친환경제품/소비전력30W/1분당1000회이상/강력한함/ 1_화이트 클린랜드'
- 'WC-1500 무선 충전 물걸레 청소기 각도조절 세척 탈수통 제공 MinSellAmount 지큐아이씨앤씨'
- '코맘스 소형 무선 물걸레청소기 그레이 PC9005G 보만코리아'
|
Evaluation
Metrics
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_el19")
preds = model("더트데빌 플립아웃 20V 리튬 무선 핸디청소기 (주)비즈온플레이스")
Training Details
Training Set Metrics
| Training set |
Min |
Median |
Max |
| Word count |
3 |
10.2791 |
18 |
| Label |
Training Sample Count |
| 0 |
2 |
| 1 |
2 |
| 2 |
50 |
| 3 |
5 |
| 4 |
2 |
| 5 |
6 |
| 6 |
14 |
| 7 |
9 |
| 8 |
26 |
| 9 |
13 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
| Epoch |
Step |
Training Loss |
Validation Loss |
| 0.0476 |
1 |
0.4954 |
- |
| 2.3810 |
50 |
0.0399 |
- |
| 4.7619 |
100 |
0.0186 |
- |
| 7.1429 |
150 |
0.0152 |
- |
| 9.5238 |
200 |
0.0155 |
- |
| 11.9048 |
250 |
0.0093 |
- |
| 14.2857 |
300 |
0.0025 |
- |
| 16.6667 |
350 |
0.0006 |
- |
| 19.0476 |
400 |
0.0037 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}