master_cate_lh10 / README.md

mini1013

Push model using huggingface_hub.

640d246 verified over 1 year ago

preview code

raw

history blame contribute delete

21 kB

metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 강아지하네스 원피스 꽃무늬 애견가슴줄 애견 공주옷 옷 고양이 그린 연청색_L 고고마트
  - text: 옷 강아지코스튬 강아지 의상 고양이 파티 처키 코스프레 교통경찰 변장_M- 약 2.5-5kg 내 핑크웨일
  - text: 찍지마라 강아지옷 강아지 코스튬 해적+더드컨트리 스티커_L(68-88CM)16~25KG 더드컨트리
  - text: 강아지패딩 퍼피엔젤 초경량 AIR2 올인원 방수 패딩 남여공용 s 1. AIR2 남여공용_#808 GREEN_S 스탠바이펫
  - text: >-
      강아지옷 고양이 봄 여름 가을 원피스 티셔츠 실내복 애견 애완견 반려견 의류 비숑 토이 푸들 말티즈 XS 옵션17. Happy
      Summer 자수 나시_옐로우_S DOGNY
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.7383331748863375
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 24 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
1.0	'버박 C.E.T. 미니칫솔 1p (색상랜덤) 주식회사 플로릿(Flowlet Co.,Ltd)' '펫 투스케어 칫솔 부드러운 칫솔모 랜덤발송 세발가락' '와우 이크린 구강 청결티슈 100매 강아지 손가락 칫솔 일회용 구강티슈 (주)어니스트펫(Honest Pet)'
21.0	'파충류부화기 알콤 렙타일 MX-R90 (일반형) MinSellAmount 초중고닷컴' '오리 조류 닭 밀짚 통집 알낳는 지푸라기 산란장 달걀 중형초가집 영운상회' '앵무새이유식 버셀라가 뉴트리버드 A21 이유식 400g 이유조먹이 넥톤 피타쿠스 A21-400g 리프패럿 대구테크노점'
14.0	'네프킨 호텔 네프킨 흰색 47x47)X10개 호텔 나유컴퍼니' '고양이 발톱 깍기 테이블 드라이 리프트 동물 거치재 스타일-A (사이즈 사진 참조) 모스트' '에이플러스 APST-2061 음이온 살균 드라이룸 중.소형 가위구조대'
12.0	'칸후 파충류 할로겐 조명 [DS-WG500] 블랙 엄마네수족관' '애완 달팽이 젤리 먹이 칼슘 용품 망고젤리 3개 안녕달팽이' '애견 애묘 패션 스카프 목걸이 목줄 -XL 블랙 티티에스(TTS)'
13.0	'고양이 격리장 이동식 대형 케이지 철장 그린빅2단78x55x100_세트2플랫폼매트x고양이볼x냥냥냥스틱x발매트x 다니컴퍼니' '도톰매트 그란데 미끄럼방지 50x50cm 07.미드나잇블루 세븐펫' '강아지 울타리 고양이 철망 펜스 ABS도어보드(소) - 화이트 심비오시스'
3.0	'클라쎄밀 분유 180g [유통24년6월15일] 불꽃(flameflawer)' '로얄캐닌 독 하이포알러제닉 스몰독 1kg 강아지 알러지 피부 결석 치아 관리 처방사료 MinSellAmount 또롱이펫' '반해 l 오픈팜 독 스튜 칠면조 354g / 계량컵&급여량 계산 어덜트 (5살 이상~7살 미만)_O & O 주식회사 집사의하루'
10.0	'네코미미 뇌파 센서 고양이 귀 움직이는 자극 소품 화이트 단색 조은물건' '푸드트럭 요기쏘 캣닢 붕어빵 인형 야자팜스토어' '캐티맨 시골 쥐꼬리 스틱낚시대 그린 해피팻스토아'
0.0	'양도가니 2p 양도가니 반컷팅(통양1개를 이등분) 영양언니의수제간식' '프레스키 칠면조힘줄 터키텐던 스트립 85g 펫스타' '닥터맘마 미니파이 케어 리브 제이컴퍼니'
2.0	'엘지 여행용세면도구세트 4호 본품 지앤아이' '와우 숨쉬는 소형 매너벨트+일자형 기저귀 2p 와우_대형 + 2P 강아지보스' '뽀숑 개끗한 세탁세제 650g 강아지 고양이 전용 손세탁 세탁기 빨래 과탄산소다 분말형 개끗한 세탁세제 650g 세제몰'
6.0	'ANF 고양이 캔 (참치게맛살) 95g 부산물X 개별캔뚜껑 젤리타입 엠에스펫푸드' '마법의 스프레이 60ml (마타타비) 멍발냥발' '비타크래프트 비타캣스틱 가자미 오메가 18g (6gx3p) 비타크래프트 크리스피 크런치 60g_덴탈(치아관리) 이누빅코리아 주식회사'
25.0	'패러그린 우다다휠 30cm 패러그린 우다다휠 (핑크) 플러스펫' '소나무 EA 가루 톱밥 베딩 축사 양계장 대패 알 대패밥 알 톱밥 (80L 마대) 권민수' '초 햄스터 집 사료 용품 먹이 톱밥 4. 햄스터 베딩_ 포그니 솜이불 30G 오타쿠 펫'
16.0	'해외사료 펠릿 제조기 닭 과립기 모이 압축기 성형기 기계 220V-5.5KW tjdnfkd591' '파충류 상처예방 실리콘 마감 밀웜 먹이 롱 핀셋 ms5863' 'RJ714 카르노 2층 햄스터하우스/햄스터 터널 케이지 MinSellAmount ┏플러스펫┓'
15.0	'강아지 월배너 인테리어 포토존 강아지집 문패 아이보리_03_웰시코기(골드) 지니걸' '강아지 월배너 인테리어 포토존 강아지집 문패 핑크_02_푸들(화이트) 지니걸' '고양이 부드러운 장식 파티 새끼 케이크 토퍼 장식품 생일 인형 곰 고무 06=A5 메리스컴퍼니'
22.0	'복주캣 고양이 스크래쳐 숨숨집 대형 1.복주캣 고양이 스크래쳐 숨숨집 우석' '아이위크 고양이 원목 우드 스크래처 미니 캣폴 캣타워 엘리펀트리빙' '키티트리 고양이 다묘용 스크래쳐 [0001]기본상품 CJONSTYLE'
11.0	'그린웨일 B3 중형 4단 카키베이지 고급 원목 튼튼한 고양이 캣타워 카키 베이지 메가글로벌002' '캣워크 선반 셀프 캣타워 캣워커 원목 고양이 벽 고양이 점프대 곰곰생활' '[제이큐]트리 디자인 방석 계단 가구 선반 원목캣타워 H타입 신세계몰'
18.0	'[기타]레드퍼피 스텔라 우주선가방 대형 카키 신세계몰' '스테판플라스트 걸리버1 철문 다크그레이라이트그레이 슈퍼패드' '와이어 대형견 강아지 소형견 리드줄 목줄 개줄 10_응급처치툴_10-2_리드줄 체결용 조은공구상사'
17.0	'바비온 휴대용 캡슐물병 V2 330ml (색상선택) 블루 주식회사 퍼스트코(FIRSTCO CO.,LTD.)' '방수스틱 전기스틱 돼지 목동 소와 양 떼몰기 클래식 버전 75cm 더니' '활성탄 필터 PF-H2 3개입 교체용 필터 라이징몰'
23.0	'대형 토끼케이지 사육장 집 강아리 고양이 가정용 애완동물 철장 기니피그 실내 울타리 72x107x62CM 인피니티스토어' '하우스 토끼 기니피그 애완 집 2층 더블 레이어 복층형 케이지 대형 홑겹[70x50x60]x매트 기저귀 백이네만물창고' '토끼 사료 먹이 집 용품 티모시 알파파 3. 토끼 간식/이갈이_ 코코넛 슬라이스 100G 오타쿠 펫'
24.0	'울리 1+1 기획 봉봉 후리스 집업 봉봉후리스집업L_베이지_베이지 (주)서흥인터내셔날' '고양이 강아지 할머니 할매 실내 김장 조끼 블루_L 두두앤코' '강아지 고양이 김장조끼 누빔 겨울 할머니 수면쪼끼 엔돌펫 꽃무늬 김장룩 조끼 핑크 S 엔돌펫 꽃무늬 김장룩 조끼_핑크_M 위드캣'
9.0	'로얄캐닌 캣 유리너리 S/O 1.5kg 행복한동물병원' '알모네이쳐 닭고기와 참치와 치즈 고양이 주식캔 습식사료 70g 알모네이쳐 주식캔 70g_참치+새우 70g 주식회사 유니커머스' '[복수구매할인] 알모네이쳐 고양이 주식캔 습식사료 대서양참치 70g 1.알모네이쳐 주식캔 70g_2. 닭고기와 참치 70g 의기냥냥'
7.0	'프롬벳 고양이 엘라이신 영양제 100g 한빛유통' '시너지랩 덴탈 후레쉬 캣 오리지널 237ml 고양이 구강청결제 와이앤케이 커머스(주)' '자이목스 오라틴 투스페이스트 젤 치약 70g 칫솔질 하지 않는 구강 관리 루나(Luna)666'
5.0	'애완용품 공 토끼 고슴도치 반려동물 수초볼 11cm (2개입) 정직한셀러8' '고슴도치 사료 용품 먹이 집 간식_치즈소세지 벅스매니아' '토끼 보온초집 둥지 돼지 보온소 귀토끼 초가집 고슴도치 애완동물 E. 스몰 (캐슬 러기 하우스) 다올'
4.0	'시너지랩 푸이 비터 스프레이 118ml(물음방지제) 다유몰' '플라스틱입마개 WK 3호 빅토리몰' '집어치워 울트라 스퀴커 볼독 장난감 소형 2직경 - 1010팩 우인'
8.0	'(미스터리)단독판매 미스터리 오더킬러 에볼루션 7kg 2개 (박스) MinSellAmount SSG.COM' '마칼 거름망 화장실(핑크) 이사둘스토어' '고양이 코일매트 화장실매트 화장실 욕실 주방 현관 발매트 빨아쓰는 발판 러그 G_60x90cm 위드해피'

Evaluation

Metrics

Label	Metric
all	0.7383

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh10")
# Run inference
preds = model("강아지하네스 원피스 꽃무늬 애견가슴줄 애견 공주옷 옷 고양이 그린 연청색_L 고고마트")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	10.0792	28

Label	Training Sample Count
0.0	50
1.0	50
2.0	50
3.0	50
4.0	50
5.0	50
6.0	50
7.0	50
8.0	50
9.0	50
10.0	50
11.0	50
12.0	50
13.0	50
14.0	50
15.0	50
16.0	50
17.0	50
18.0	50
21.0	50
22.0	50
23.0	50
24.0	50
25.0	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0053	1	0.4146	-
0.2660	50	0.3778	-
0.5319	100	0.315	-
0.7979	150	0.2096	-
1.0638	200	0.146	-
1.3298	250	0.0963	-
1.5957	300	0.0549	-
1.8617	350	0.049	-
2.1277	400	0.0339	-
2.3936	450	0.0339	-
2.6596	500	0.0322	-
2.9255	550	0.0263	-
3.1915	600	0.0179	-
3.4574	650	0.0202	-
3.7234	700	0.0127	-
3.9894	750	0.0293	-
4.2553	800	0.0116	-
4.5213	850	0.0264	-
4.7872	900	0.012	-
5.0532	950	0.009	-
5.3191	1000	0.0139	-
5.5851	1050	0.0116	-
5.8511	1100	0.024	-
6.1170	1150	0.0046	-
6.3830	1200	0.0046	-
6.6489	1250	0.0081	-
6.9149	1300	0.0099	-
7.1809	1350	0.0108	-
7.4468	1400	0.0006	-
7.7128	1450	0.01	-
7.9787	1500	0.0098	-
8.2447	1550	0.0099	-
8.5106	1600	0.0063	-
8.7766	1650	0.006	-
9.0426	1700	0.0016	-
9.3085	1750	0.0054	-
9.5745	1800	0.0011	-
9.8404	1850	0.0056	-
10.1064	1900	0.0095	-
10.3723	1950	0.0006	-
10.6383	2000	0.0081	-
10.9043	2050	0.0002	-
11.1702	2100	0.0002	-
11.4362	2150	0.0041	-
11.7021	2200	0.0021	-
11.9681	2250	0.0002	-
12.2340	2300	0.0021	-
12.5	2350	0.004	-
12.7660	2400	0.0002	-
13.0319	2450	0.0002	-
13.2979	2500	0.0021	-
13.5638	2550	0.0012	-
13.8298	2600	0.0038	-
14.0957	2650	0.0072	-
14.3617	2700	0.002	-
14.6277	2750	0.0018	-
14.8936	2800	0.0018	-
15.1596	2850	0.0002	-
15.4255	2900	0.0007	-
15.6915	2950	0.0003	-
15.9574	3000	0.0002	-
16.2234	3050	0.0001	-
16.4894	3100	0.0001	-
16.7553	3150	0.0001	-
17.0213	3200	0.0001	-
17.2872	3250	0.0001	-
17.5532	3300	0.0001	-
17.8191	3350	0.0001	-
18.0851	3400	0.0001	-
18.3511	3450	0.0001	-
18.6170	3500	0.0001	-
18.8830	3550	0.0001	-
19.1489	3600	0.0001	-
19.4149	3650	0.0001	-
19.6809	3700	0.0001	-
19.9468	3750	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}