master_cate_el4 / README.md

mini1013

Push model using huggingface_hub.

09ecae3 verified over 1 year ago

preview code

raw

history blame contribute delete

18.9 kB

metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 귀뚜라미 전기 온수기 50리터 저장식 식당 카페 미용실 온수기 설치 KDEW 상품만 구매(셀프설치)_G-15(벽걸이형) 조아홈시스
  - text: 크레모아 선풍기 V1040 서큘레이터 웜그레이 (주)가야미
  - text: '[나비아] 가스히터 SGH-200  낚시 1번지(피싱매니저)'
  - text: 바이빔 닥스훈트 전기방석[1인용] 1인용 주식회사 바이빔
  - text: >-
      [정발 한국판] [샤오미코리아 정품][온라인총판 직영점] 미에어 스마트 4 AC-M16-SC 공기청정기 미에어
      공기청정기4(AC-M16-SC) (주)더데이
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.87719191055172
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 19 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
12	'스팀보이 카본 제로매트 ST212-B22S 싱글 원적외선 방출 탄소 온수매트 주식회사 동양이지텍' '경동나비엔 나비엔메이트 더 케어 EQM541 EQM541 안아주라' '경동나비엔 숙면매트 온수 EQM595-SS 싱글 피치타임(영종하늘도시점)'
8	'신일 에어커튼 원모터 SAC-1900hs (900) SAC-11000HS(1000) (주)투리남' '신일 원모터 에어커튼 SAC-1900HS 벌레 먼지 외부공기차단 FINE 파인테크놀로지' '에어커튼 대성 ADS-CC09 1000밀리 출입문 날벌레방어 외부내부겸용 업소용에어커튼 보냉보온 강력풍속 HACCP 저소음 투모터형(1200m) 대성종합상사'
9	'위니아 WVV06ENK 자가설치 동의 칙바이핏' '위니아 EVA06ENW 정품(Best Quality)스토어' '기본설치비포함 수도권 FQ18ET1BA2 엘지 오브제 컬렉션 타워2 멀티형 김재운'
5	'대성셀틱 라디에이터 DSRA-15핀 전기히터 난방 실내 가정용 사무실 소형 중형 대형 하나유통' '대성셀틱 S라인 전기라디에이터 DSRA-9 (라지에이터/히터/난로) 주식회사 더이엔' '신일 컴팩트 SER-D5500KP 라디에이터 5핀 /HB 주식회사 에이치비스토어'
18	'[신년맞이 앵콜 빅세일] [910207] 위너웰 노매드 뷰 쿡 텐트 우드스토브 화목난로 / M사이즈 알캠몰' '우드앤번 노틸러스R2 펠릿난로 펠릿연소기 R2호퍼세트 (주)에이블에스원' '컴팩트 펠렛난로 화목난로 펠릿 나무 장작난로 CZWP3 컴팩트 펠렛난로 화목난로 펠릿 나무 장작난로 CZ-WP3 마티나 펠렛난로 화목난로 펠릿 나무장작 난로 더리틀(the little)'
1	'[삼성전자] 블루스카이 CFX-C100D 삼성정품필터 7000시리즈 일체형필터 [택배발송] (주)컴퓨존' '힘펠 욕실전동댐퍼 MDD-100DP-P 아파트 오피스텔 빌라 상가 담배냄새제거 역류방지 직접설치 방문설치(설치비현장결제) 메이봄' '힘펠 환풍기 제로크 화장실냄새 차단 HV3-80X(MD-N) 전동댐퍼 일체형 방문설치(현장결제) 주식회사스위치온'
10	'COMBO-119 /ARC-1362/AF-TB151WNAE/HPX-N158N/AS-T101NVS/PA-A045G1/LP-C121BUA/AS-G64DV/AF-TS151WLGS 지에이치스토어' 'COMBO7325 (LG에어컨리모콘 AKB75215317 FNQ167WCPW TNW130QM2SR RNW0721G2S SNQ110PC5W) 지쓰리샵' '듀얼인버터 두번째 창틀 브라켓 (듀얼인버터/미니용) 프리미엄2 필요X 기본키트용(\ufeffPWA-ST2NB) (주)파세코'
11	'ESW550-15W 하향식 경동나비엔 전기온수기 15L 스텐 벽걸이 15리터 경동온수기 히트랩' '경동 전기온수기 50 리터 L 법랑 세로형 저장식 온수기 ESW351-50WV ESW351-15U_설치의뢰(설치비별도) 디시몰' '온아워 전기 온수기 순간 미니 세면대 싱크대 수도꼭지 주식회사 제이앤씨월드'
3	'아이룸 미니 가습기 냉온풍 HW7 히터 손난로 블루 조은나무' '수도권 기본설치비 포함 캐리어 인버터 스탠드 냉난방기 CPV-Q167SB 냉온풍기 에스오(S.O) 시스템' 'CSV-Q165B 16평 벽걸이 인버터 냉난방기 수도권 실외기포함 기본설치비포함송 주원시스템'
15	'보국전자 에어셀 세탁가능 전기요 캠핑 매트 장판 전자파방지 2인용 더블 BKB-0604D 뉴트로' '보이로 풋워머 FW20 코스트코 그레이 모파상' '국산 벌룬 USB온열방석/엉따/온열시트 텍1 그레이 (주) 해성비엔씨'
0	'넥스트 워터캡슐 NEXT-230MH NEXT-231MH 전용 필터 (주)디아씨앤씨' '조지루시 EE-DCH35K 최고의수준' '루메나 MIST STAND 코튼필터 MIST STAND 코튼필터_4EA (주) 루메나'
7	'루메나 FAN PRIME 2세대 네이비블루 머니트리' '보네이도 633DC 보보스하니' '프롬비사일런트스톰 미니 휴대용 선풍기 접이식 무소음 탁상겸용 FA135 케이스토어'
4	'이노크아든 에어쿨러 냉풍기 이동식 가정용 업소용 얼음선풍기 IA-L10 주식회사 라자가구몰' '한경희생활과학 HEF-8200 HEF-8200 아래서위로' '한빛 소형 냉풍기 원룸 가정용 HV-4802 리모컨 씨에스존'
14	'헤링본 우드 전기장판 17mm 특대형183x270 분리난방 리빙컨테이너' '경동나비엔 숙면매트 카본 EME521 하이퍼셀(hypersell)' '한일꽃잠 파라오 프리미엄 싱글 온열매트 (주)하이드릭텍'
6	'[대성쎌틱] 대성 IOT 스마트 온도조절기 DR-910W 우리유통,에스제이산업' '우리엘 UTH-200RS 골드 난방필름 온도조절기 통신용 본품(센서미포함) (주)세명에너지' '[귀뚜라미] 귀뚜라미 보일러 온도조절기 CTR-5000 우리유통,에스제이산업'
16	'위닉스 DXTE120-MPK 위닉스 DXTE120-MPK_제3자의 배송관련 개인정보 이용에 대해 동의함 주나주리' '(13) 한일전기 HDS-1800B 동의합니다._한일전기 HDS-1800B 예스컴퍼니' 'LG전자 휘센 DQ203PECA (Y자 호스 포함//배송 1~2주 내) 코코클래식'
13	'LC-L53 토요토미팬히터 12평 석유난로 캠핑난로 안방난로 석유스토브 자동점화 일본정품 21Century (센추리)' '토요토미 LC-L53 팬히터 정품 1200 캠핑히터 저전력전기히터 등유난로 캠핑난로 캠핑트렁크 창원점' '에어렉스 소방서 곱창난로 AH1839 55평 등유히터 늘푸른종합상사'
17	'SMATO 스마토 컨벡터히터 CVH-1000N 윈윈툴' '피스토스 전기컨벡터 벽걸이형 기본 PT-2000 욕실난방기 겨울동파방지 2000W PT-2000 히트랩' '신일 컨벡터 전기히터 SEH-C210 신일히터 컨벡션히터 /HB 주식회사 에이치비스토어'
2	'비나잇 프리미엄 온수매트 세탁 워셔블 스몰 싱글 침대용 슈퍼싱글(1100x1900)_단일난방(침대용) 주식회사모아그룹' 'HAPEL 냉온수매트 슬립케어 싱글 HAPEL ' 'HAPEL 냉온수매트 슬립케어 싱글 HAPEL '

Evaluation

Metrics

Label	Metric
all	0.8772

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el4")
# Run inference
preds = model("바이빔 닥스훈트 전기방석[1인용] 1인용 주식회사 바이빔")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	9.2892	26

Label	Training Sample Count
0	50
1	50
2	13
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0070	1	0.4968	-
0.3497	50	0.3841	-
0.6993	100	0.1946	-
1.0490	150	0.1001	-
1.3986	200	0.0434	-
1.7483	250	0.0383	-
2.0979	300	0.0221	-
2.4476	350	0.0183	-
2.7972	400	0.0279	-
3.1469	450	0.0213	-
3.4965	500	0.0159	-
3.8462	550	0.0169	-
4.1958	600	0.012	-
4.5455	650	0.0093	-
4.8951	700	0.004	-
5.2448	750	0.001	-
5.5944	800	0.0061	-
5.9441	850	0.0061	-
6.2937	900	0.0014	-
6.6434	950	0.0005	-
6.9930	1000	0.0003	-
7.3427	1050	0.0002	-
7.6923	1100	0.0002	-
8.0420	1150	0.0002	-
8.3916	1200	0.0002	-
8.7413	1250	0.0002	-
9.0909	1300	0.0001	-
9.4406	1350	0.0002	-
9.7902	1400	0.0001	-
10.1399	1450	0.0001	-
10.4895	1500	0.0001	-
10.8392	1550	0.0001	-
11.1888	1600	0.0001	-
11.5385	1650	0.0001	-
11.8881	1700	0.0001	-
12.2378	1750	0.0001	-
12.5874	1800	0.0001	-
12.9371	1850	0.0001	-
13.2867	1900	0.0001	-
13.6364	1950	0.0001	-
13.9860	2000	0.0001	-
14.3357	2050	0.0001	-
14.6853	2100	0.0001	-
15.0350	2150	0.0001	-
15.3846	2200	0.0001	-
15.7343	2250	0.0001	-
16.0839	2300	0.0001	-
16.4336	2350	0.0001	-
16.7832	2400	0.0001	-
17.1329	2450	0.0001	-
17.4825	2500	0.0001	-
17.8322	2550	0.0001	-
18.1818	2600	0.0001	-
18.5315	2650	0.0	-
18.8811	2700	0.0001	-
19.2308	2750	0.0001	-
19.5804	2800	0.0001	-
19.9301	2850	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

Label	Training Sample Count
0	50
1	50
2	13
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Label	Training Sample Count
0	50
1	50
2	13
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Label	Training Sample Count
0	50
1	50
2	13
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50