master_cate_el14 / README.md

mini1013

Push model using huggingface_hub.

c8cd0a7 verified about 1 year ago

preview code

raw

history blame contribute delete

20.4 kB

metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 소니 WH-CH520 블루투스헤드셋 정품 WH-CH520/BZE 블랙 주식회사 스피티
  - text: 코스 스튜디오용 헤드폰 스탠다드 패키징 블랙 풀사이즈 Pro4AA 1) Standard Packaging 제이크루
  - text: 브리츠 P510GX 유선이어폰 음악+통화 언더이어 오픈형  (주)엠글로벌스
  - text: 브리츠 BZ-MQ7 휴대용 FM라디오 효도라디오 블루투스 스피커 블랙 하나전산
  - text: >-
      SOUNDCRAFT NOTEPAD-12FX 사운드 크래프트 노트패드12FX 아날로그 믹서/USB 오디오 인터페이스 [공식수입정품] 
      사운드필
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.7123194792867313
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 22 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
12	'[BOSE] 보스 옴니 주얼 실링(천장) 브라켓 (서라운드 스피커 700 전용) 블랙 세트 코오롱모빌리티그룹 주식회사' '마샬 엠버튼2 블루투스 캠핑 스피커 크림 휴대용 연동가능 엠버튼II 앰버튼 일대의 고배급 삼림녹은 한 야드씩이다. 두즈 몰' 'GENPRO SS-2스피커스탠드 공연 무대 버스킹용 1개가격 제이에스사운드'
8	'카날스BKM-150 컴비네이션 테이블타입 미니앰프 포도나무' 'Denon AVR-X250BT/수입正品/5.1CH AV 리시버 주누 트레이드 (JUNU TRADE)' '카날스 KQ-800W 4채널 800W 파워앰프 교회 노래방 장 앰프 사운드테크'
15	'웨이코스 씽크웨이 TONE BOB SHOCK 8D 주식회사 브라보세컨즈' '[스페셜케이스]젠하이저 IE 100 pro Wired 모니터링 인이어 이어폰 레드(RED) 찬양랜드' '[Sennehiser] 젠하이저 IE200 모니터링 이어폰 인이어 온더그랩'
21	'Britz 브리츠인터내셔널 BZ-T3400 AV SoundBar 주식회사 동행하기' '[Britz] 브리츠 BZ-T2230S AV Soundbar 블루투스 사운드바 시스템 더그랩사운드' '드비알레 디온(DEVIALET DIONE) 사운드바 (주)울타리컴퍼니'
17	'Britz 브리츠인터내셔널 BZ-C3900RT 주식회사 레오솔루션' 'Britz 브리츠인터내셔널 BZ-BBX2 주식회사 에스씨엠인포텍' '코비 냥냥이 댕댕이 블루투스 CD플레이어 BTCD7 FM라디오 어학용 스마트폰 음악재생 냥냥이 (주)디피이'
20	'ULTRASONE 울트라손 헤드폰 Signature Pure 국내정품 1년보증AS 윤테크(YOON TECH)' '터틀비치 아틀라스 에어 Atlas Air 무선 게이밍 헤드셋 (주)베스트파이브' '재고당일발 노이만 NDH30 Black Edition Neuman NDH 30 블랙에디션 한정판 오픈형 모니터링용 정품보증서 NDH30 블랙에디션한정판:당일발송 신화'
13	'NMA-LB433 스피커 관절형 벽걸이 거치대(2.6kg) 서준전자' 'Britz 브리츠인터내셔널 BZ-T7780 (주)빈컴' '루악오디오 R3s ruarkaudio 국내정품 Rich Walnut (월넛) 라이프스타일샵'
19	'블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 ' '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 ' '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
10	'[재고보유/당일출고] 한글설명서 뮤직랜드 Behringer XR18 베링거18 xr-18 디지털믹서 뮤직랜드' '베링거 DI100 1채널 액티브 다이렉트 박스 DI 주식회사 뮤존(MUZON)' '베링거 DI-100 다이렉트박스, DIBOX 토포스사운드'
6	'CDP-1000 ENW USB 1CD PLAYER 클럽/스포츠센터/매장 CDA1000USB CDA1000USB옴니트로닉 비비케이사운드' '-네이버회원 추가쿠폰-빈센트 CD-S7 DAC 진공관 하이브리드 CD플레이어 [VINCENT] 0 주식회사 탑제이앤에이취' 'DENON (데논) DCD-A110 / 110주년 기념 CD 플레이어 무진AV상사'
18	'[CROSLEY 크로슬리] Musician 뮤지션 엔틱 감성 올인원 CD 테이프 블루투스 턴테이블 CR704B ITDictionary' '휴라이즈 HR-TS100 LP 텐테이블 주식회사 씨알텍' '디앤비인터내셔널 휴라이즈 HR-TS100 (주)아토닉스'
1	'iFi Audio ZEN DAC Signature V2 아이파이 고해상도 데스크탑 DAC 젠덱 시그니처 서울악기' 'iFi audio Go blu 소형 HD블루투스 DAC 앰프 윌텍미디어' 'TOPPING DX5 Lite 블루투스DAC 토핑 DX5 헤드폰앰프 블랙 (주)제이엘더블유'
14	'마이다스 M32R LIVE/마이다스 총판 공식 인증 대리점/마이다스 정품[재고 보유/당일 출고] 한솔전자' 'Solid State Logic SSL 2+ (연말 연초 세일 2월29일까지) (주)국제미디' 'Pioneer DJ DDJ-FLX4 파이오니아 디제이 2채널 디제이 컨트롤러 (주)뮤직메트로'
0	'데논(DENON) DCD-600NE CD플레이어(실버) (주)음자리' '댕댕이 포터블 탁상용 블루투스 어학 공부 아기 CD플레이어 BTCD10 냥냥이 (주)아임커머스' 'ENZER(엔저) EN-CD1BT CD플레이어 USB 블루투스 원목디자인 월넛 (재고보유) 원형사운드'
7	'Britz 브리츠인터내셔널 BZ-R120 (블랙) 휴대용 미니 효도라디오 (주)아이텐츠' 'Britz 브리츠인터내셔널 BZ-LV980 블루투스 라디오 MP3 스피커 블랙 (주)가이드컴' 'Britz LED 대나무 FM 라디오 알람 온도 시계 BZ-E2R 아이티조이'
2	'에픽 E100B 블루투스MP3플레이어 / FM라디오 내장스피커 동영상 TF32GB확장 1. 초콜렛(4GB) 에픽' '아스텔앤컨 Astell&kern KANN ULTRA DAP 주식회사 그린파워테크' 'w Britz BZ-MP4580BL /MP3/녹음기/라디오/블루투스 (주)원영씨앤씨'
11	'[Apple 에어팟] 애플 에어팟 유선 충전 2세대 (국내 정식 발매 제품) MV7N2KH/A Apple AirPods 2nd Gen (Korean Ver.) 슈박스 (Shoe Box)' '샥즈 오픈런 프로 S810 블랙 골전도 블루투스 무선 이어폰 Shokz 수영 등산 운동 스포츠 액티비티 아웃도어 (국내정품, 2년 보증) 1. 블랙 클레디오' '포칼 FOCAL Bathys/수입正品/노이즈 캔슬링/블루투스/하이파이 주누 트레이드 (JUNU TRADE)'
5	'케이뮤직박스 서영엔터테인먼트 AV-1000 이동식노래방 휴대용 캠핑 충전용 야외용 우림미디어' '미가엘 E9S 찬송가 반주기 리모콘 마이크포함 복음성가 성경낭독 지에스음향' '미가엘 E9S E-9S 찬양반주기 찬양연주기 이니트(INNIT)'
9	'[KANALS]카날스 MJ-117 MJ117 원터치 T자형 마이크스탠드 공연용녹음용보컬용 김청애' 'LEWITT LCT440 PURE 르윗 프로 콘덴서 마이크 보컬 홈레코딩 공연 방송 녹음 멘토나무' '스토리하우스 네코 NK-UA600 2021년형 번슬리'
3	'아이리버 아스텔앤컨 AK-RM01 블루투스 리모컨 다손아이앤씨' 'COMS) 3.7V 리튬이온 배터리(BL-5B) 라디오/UB714 비스티앤씨' '미테르 케이스 아스텔앤컨 HB1 커버 MITER Astell&Kern AK HB1 case (착탈식 목걸이 줄 포함 팩키지) 네이비 (이태리PU인조합성가죽) 굿씨드인터내셔널'
16	'로마네 Romane 365 포켓 에어팟 파우치 그라미상점' '에어팟 프로 실리콘 케이스 키링 1세대 2세대 공용 에어팟프로(1/2세대공용)실리콘케이스(그린) 아이킨' '플래나 에어플레인 티켓 시리즈 에어팟 프로 커스텀 TPU 투명 케이스 에어팟 1/2세대_1. 서울 주식회사 플랜지'
4	'토마토 5인치 PMP익스트림터치 8GB+전용충전기 5인치 익스트림터치16G 주식회사 스피티' '코원 스터디프로 V7 32GB+펠트파우치 /MP3/PMP 주식회사 스피티' '[AS 1년보증+코원 온라인 공식판매처+재고확보] 코원 스터디프로 V7 32GB+펠트파우치/MP3/PMP [코원]스터디프로V7[32GB][화이트] (주)엠피나비'

Evaluation

Metrics

Label	Metric
all	0.7123

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el14")
# Run inference
preds = model("브리츠 P510GX 유선이어폰 음악+통화 언더이어 오픈형  (주)엠글로벌스")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	9.4791	33

Label	Training Sample Count
0	50
1	50
2	50
3	12
4	4
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50
19	13
20	50
21	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0065	1	0.497	-
0.3268	50	0.3791	-
0.6536	100	0.2221	-
0.9804	150	0.1258	-
1.3072	200	0.0648	-
1.6340	250	0.0513	-
1.9608	300	0.0383	-
2.2876	350	0.0297	-
2.6144	400	0.0308	-
2.9412	450	0.0208	-
3.2680	500	0.0132	-
3.5948	550	0.0188	-
3.9216	600	0.0196	-
4.2484	650	0.0158	-
4.5752	700	0.0061	-
4.9020	750	0.009	-
5.2288	800	0.0107	-
5.5556	850	0.0048	-
5.8824	900	0.0024	-
6.2092	950	0.0077	-
6.5359	1000	0.0023	-
6.8627	1050	0.0077	-
7.1895	1100	0.006	-
7.5163	1150	0.003	-
7.8431	1200	0.0046	-
8.1699	1250	0.0062	-
8.4967	1300	0.003	-
8.8235	1350	0.0022	-
9.1503	1400	0.0004	-
9.4771	1450	0.0003	-
9.8039	1500	0.0003	-
10.1307	1550	0.0022	-
10.4575	1600	0.0006	-
10.7843	1650	0.0002	-
11.1111	1700	0.0002	-
11.4379	1750	0.0002	-
11.7647	1800	0.0029	-
12.0915	1850	0.0002	-
12.4183	1900	0.0001	-
12.7451	1950	0.0001	-
13.0719	2000	0.0001	-
13.3987	2050	0.0001	-
13.7255	2100	0.0001	-
14.0523	2150	0.0002	-
14.3791	2200	0.0001	-
14.7059	2250	0.0001	-
15.0327	2300	0.0001	-
15.3595	2350	0.0001	-
15.6863	2400	0.0001	-
16.0131	2450	0.0002	-
16.3399	2500	0.0001	-
16.6667	2550	0.002	-
16.9935	2600	0.0001	-
17.3203	2650	0.002	-
17.6471	2700	0.0001	-
17.9739	2750	0.0001	-
18.3007	2800	0.0001	-
18.6275	2850	0.0001	-
18.9542	2900	0.0021	-
19.2810	2950	0.0001	-
19.6078	3000	0.0001	-
19.9346	3050	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

Label	Training Sample Count
0	50
1	50
2	50
3	12
4	4
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50
19	13
20	50
21	50

Label	Training Sample Count
0	50
1	50
2	50
3	12
4	4
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50
19	13
20	50
21	50

Label	Training Sample Count
0	50
1	50
2	50
3	12
4	4
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50
19	13
20	50
21	50