master_cate_bc13 / README.md

mini1013

Push model using huggingface_hub.

14ec528 verified about 1 year ago

preview code

raw

history blame contribute delete

17.9 kB

metadata

tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 빨수있는 헝겊 공구가방 남자 아기 출산선물 육아템 캠핑장난감 유아놀이 장남감 1개  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
  - text: 꼬마실로폰 완구 원목블록 출산 매트 육아  출산/육아 > 완구/인형 > 음악/악기놀이
  - text: 아이링고 뉴 스타터세트 212pcs 블럭장난감 유치원교구  출산/육아 > 완구/인형 > 블록
  - text: 쿠쿠토이즈 코코몽 모래놀이 완구 출산 육아 매트  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
  - text: 유아용품 레드박스 뉴 주방놀이세트 완구 육아 출산 매트  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
metrics:
  - accuracy
pipeline_tag: text-classification
library_name: setfit
inference: true
base_model: mini1013/master_domain

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 18 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
17.0	'포켓몬카드 오리진 디아루가 Vstar UR 유니버스 [S] 출산/육아 > 완구/인형 > 캐릭터카드/딱지' '[리틀램스쿨][칭찬교구] 칭찬딱지(Chips Collector) C_2 출산/육아 > 완구/인형 > 캐릭터카드/딱지' '매직 MH3 SPG 커스텀 TCG 카드 네크로도미넌스 나두 날개 달린 Wisdom Kozilek 부정한 출산 의식 대리인의 깨진 현실 플레어 출산/육아 > 완구/인형 > 캐릭터카드/딱지'
7.0	'꿈나라 자동 오르골모빌 흑백 컬러 신생아 아기 침대 수동 동물 도형 인형 애기 하트흑백 모빌 출산/육아 > 완구/인형 > 신생아/영유아완구' '에뜨와 임신출산선물 코니딸랑이세트 07P083101 출산/육아 > 완구/인형 > 신생아/영유아완구' '[모노레임] [단품][2025 뱀띠 출산선물][태명자수]햇뱀 딸랑이 인형(toy) 출산/육아 > 완구/인형 > 신생아/영유아완구'
13.0	'영유아용품 비키즈 투칸 피아노놀이 육아 완구 신생아 매트 출산 출산/육아 > 완구/인형 > 음악/악기놀이' '핑크퐁 육아 출산 음악 악기놀이 아기상어 피아노 둥이선물 키즈카페 음량 출산/육아 > 완구/인형 > 음악/악기놀이' '유아악기 파도소리 핸드드럼 구슬탬버린 출산선물 출산/육아 > 완구/인형 > 음악/악기놀이'
0.0	'애플비 신생아 초점책 아기초점책 4권 출산/육아 > 완구/인형 > 감각발달완구' '아기 헝겊책 모음 코야 누가숨었지 초점 헝겊책 무당벌레 출산/육아 > 완구/인형 > 감각발달완구' '1+1 정품 국민 애벌레 인형 촉감 감각 애착인형 백일 아기 장난감 출산/육아 > 완구/인형 > 감각발달완구'
12.0	'꼭지퍼즐 핑크퐁 탈것 그림퍼즐 육아 완구 매트 출산 유아동퍼즐 출산/육아 > 완구/인형 > 유아동퍼즐' '멜로디 동물퍼즐 유아장난감 출산선물 아기장난감 출산/육아 > 완구/인형 > 유아동퍼즐' '쌍문상회 캐치티니핑 시즌3 직소퍼즐 150pcs 액자 유아동퍼즐 완구 매트 출산 육아 출산/육아 > 완구/인형 > 유아동퍼즐'
16.0	'손오공 탑블레이드 드래셀S 출산/육아 > 완구/인형 > 작동완구' '포켓몬스터 팽이 세트 포켓몬팽이 2개 배틀판 출산/육아 > 완구/인형 > 작동완구' '손오공 메탈베이블레이드 4D 엘드라고디스트로이 F:S 출산/육아 > 완구/인형 > 작동완구'
14.0	'뽀로로 봉제인형 패티 루피 크롱 에디 해리 포비 출산/육아 > 완구/인형 > 인형' '옹알이 콩콩이 콩순이 동생 인형 장난감 출산/육아 > 완구/인형 > 인형' '젤리캣 국민애착인형 블라썸 크림 버니 L 출산/육아 > 완구/인형 > 인형'
2.0	'아기 전신운동 방울 손잡이 유아 목튜브 대근육 출산선물 출산/육아 > 완구/인형 > 물놀이용품' '즈램린 애니멀 미니 워터건 물총 매트 육아 완구 물놀이용품 출산 출산/육아 > 완구/인형 > 물놀이용품' '유아 놀이풀장 엠보싱바닥 아기풀장 수영장 소형 출산/육아 > 완구/인형 > 물놀이용품'
3.0	'엉뚱발랄콩순이 물감색칠놀이3 출산/육아 > 완구/인형 > 미술놀이' '스크레치페이퍼출산/육아완구/매트미술놀이기타미술놀이 출산/육아 > 완구/인형 > 미술놀이' '치킨만들기 미니어쳐 양념후라이드 패스트푸드 출산 육아 미술놀이 위블센 출산/육아 > 완구/인형 > 미술놀이'
6.0	'비바 뉴 프리미엄 145 킥보드 스쿠터 씽씽이 접이식 출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이' '마이크로킥보드 마이크로킥보드 미니 핸드 디럭스 LED 라벤더 출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이' '마이크로킥보드 미니 투고 디럭스 플러스 LED 푸쉬바 세트 출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이'
4.0	'아이링고 뉴 스타터세트 212pcs 블럭장난감 유치원교구 출산/육아 > 완구/인형 > 블록' '18개월~3세 안심 장난감 블록 테이블 세트 출산/육아 > 완구/인형 > 블록' '듀플로호환 유아대형블럭장난감 통큰블럭 소방 경찰 병원 출산/육아 > 완구/인형 > 블록'
9.0	'영유아용품 레드박스 뉴 피자놀이세트 매트 완구 출산 육아 출산/육아 > 완구/인형 > 역할놀이/소꿉놀이' '김밥가게놀이 매트 육아 완구 출산 원목블록 민릿느 출산/육아 > 완구/인형 > 역할놀이/소꿉놀이' '과일썰기놀이 완구 원목블록 출산 육아 매트 출산/육아 > 완구/인형 > 역할놀이/소꿉놀이'
5.0	'세계유통 말랑말랑 키즈볼세트 육아 완구 출산 매트 소프트볼 공 출산/육아 > 완구/인형 > 스포츠완구' '쿠쿠토이즈 동물볼링 육아 매트 출산 완구 출산/육아 > 완구/인형 > 스포츠완구' '농구놀이 농구대 스포츠완구 완구 매트 출산 육아 출산/육아 > 완구/인형 > 스포츠완구'
11.0	'어린이 세발 자전거 1-3-6 세 아기 영 유아 5세 임산부 출산 신혼부부 집들이 선물 덮게 없는 블루 1개 출산/육아 > 완구/인형 > 유아/어린이자전거' '48개월 세발자전거 유모차 보호자 손잡이 캐노피자전거(그레이) 주행 튼튼한 1개 출산/육아 > 완구/인형 > 유아/어린이자전거' '돌아기자전거 두돌 아기 자전거 3살 트라이크 36개월 30개월 출산/육아 > 완구/인형 > 유아/어린이자전거'
8.0	'아리아띠 얼굴 몸통 두조각 동물 퍼즐 두돌 두뇌활동 출산선물 출산/육아 > 완구/인형 > 언어/학습완구' '어린이 놀이영어 원목 알파벳자석블럭 4세 유치원생 출산선물 출산/육아 > 완구/인형 > 언어/학습완구' '뚜뚜아트 세이펜 아기포스터 유아병풍 아기벽보 코팅 종이 숫자1-100 출산/육아 > 완구/인형 > 언어/학습완구'
15.0	'프레파라트 생물 과학교구 출산 자연 프레파라트 육아 생물 학습교구 출산/육아 > 완구/인형 > 자연/과학완구' '어린이완구소프트 안킬로 사우르스 반디 공룡 출산 자연 매트 출산/육아 > 완구/인형 > 자연/과학완구' '반디 소프트 카르노타우르스 공룡 완구 자연 매트 출산 육아 출산/육아 > 완구/인형 > 자연/과학완구'
1.0	'주택 마당 튼튼살대 2인용 어린이 그네 출산선물 유치부 출산/육아 > 완구/인형 > 공간놀이기구' '출산선물 오래타는 튼튼 국산 방문그네 키카 유아그네 흔들그네 출산/육아 > 완구/인형 > 공간놀이기구' '쿠쿠토이즈 에듀플레이하우스 바이올렛 완구 놀이집 매트 육아 출산 출산/육아 > 완구/인형 > 공간놀이기구'
10.0	'유치원 4세반 학습교구 손가락발달 큐브 구슬타워 성취감 돌아기 성장 출산/육아 > 완구/인형 > 원목교구/가베' '원목링쌓기 롤러코스터 아기상어 핑크퐁 가베 출산 원목교구 카룰빈 출산/육아 > 완구/인형 > 원목교구/가베' '다채로운 모양 블록 분류 게임 몬테소리 학습 교육 완구 비비 출산 인니 퍼즐 선물 출산/육아 > 완구/인형 > 원목교구/가베'

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_bc13")
# Run inference
preds = model("꼬마실로폰 완구 원목블록 출산 매트 육아  출산/육아 > 완구/인형 > 음악/악기놀이")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	7	14.3937	25

Label	Training Sample Count
0.0	20
1.0	20
2.0	20
3.0	20
4.0	20
5.0	20
6.0	8
7.0	20
8.0	20
9.0	20
10.0	20
11.0	20
12.0	20
13.0	20
14.0	20
15.0	20
16.0	20
17.0	20

Training Hyperparameters

batch_size: (256, 256)
num_epochs: (30, 30)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 50
body_learning_rate: (2e-05, 1e-05)
head_learning_rate: 0.01
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
l2_weight: 0.01
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0147	1	0.4769	-
0.7353	50	0.4673	-
1.4706	100	0.1769	-
2.2059	150	0.0467	-
2.9412	200	0.012	-
3.6765	250	0.0068	-
4.4118	300	0.0067	-
5.1471	350	0.0043	-
5.8824	400	0.0022	-
6.6176	450	0.0001	-
7.3529	500	0.0001	-
8.0882	550	0.0001	-
8.8235	600	0.0001	-
9.5588	650	0.0001	-
10.2941	700	0.0001	-
11.0294	750	0.0001	-
11.7647	800	0.0	-
12.5	850	0.0	-
13.2353	900	0.0	-
13.9706	950	0.0	-
14.7059	1000	0.0	-
15.4412	1050	0.0	-
16.1765	1100	0.0	-
16.9118	1150	0.0	-
17.6471	1200	0.0	-
18.3824	1250	0.0	-
19.1176	1300	0.0	-
19.8529	1350	0.0	-
20.5882	1400	0.0	-
21.3235	1450	0.0	-
22.0588	1500	0.0	-
22.7941	1550	0.0	-
23.5294	1600	0.0	-
24.2647	1650	0.0	-
25.0	1700	0.0	-
25.7353	1750	0.0	-
26.4706	1800	0.0	-
27.2059	1850	0.0	-
27.9412	1900	0.0	-
28.6765	1950	0.0	-
29.4118	2000	0.0	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0
Sentence Transformers: 3.3.1
Transformers: 4.44.2
PyTorch: 2.2.0a0+81ea7a4
Datasets: 3.2.0
Tokenizers: 0.19.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}