master_cate_el20 / README.md

mini1013

Push model using huggingface_hub.

17db187 verified about 1 year ago

preview code

raw

history blame contribute delete

18.4 kB

metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 빌트록스 85mm F1.8 STM AF II 소니 풀프레임 FE-mount  주식회사 에스에이치몰
  - text: 185CM 카메라 스마트폰 삼각대 SEL-ML185K  주식회사 셀루미
  - text: 켄코 리얼프로 REALPRO UV 필터 43mm(포켓융+렌즈클리너)/JW  (주)제이더블피앤엘
  - text: 후지필름 XC35mm F2 렌즈 정품 입고완료 구매가능 주식회사 제이에스헤럴드나인
  - text: 캐논 RF 100-500mm F4.5 7.1 L IS USM 망원렌즈 VSGO DKL-20 오.케이.굳 주식회사
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.8190048035472349
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 19 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
1	'인스탁스 미니에보 Evo 액정보호필름 주식회사 제이에스헤럴드나인' 'DJI 오즈모 액션3 올레포빅 고광택 액정 보호필름 2세트 주식회사 좀비베리어' '소니 알파 강화유리 액정보호필름 A7C 미러리스 전용 주식회사 리디브'
18	'[후지필름]일회용카메라 심플에이스 / /필름감성 에프컴퍼니' 'KODAK H35 하프 필름카메라 토이카메라 - Sage (주)디지안' 'HARMAN XP2 Super 흑백 일회용카메라 (ISO400-27컷) 지오엔스토어'
5	'주)가게 고프로 정품 쇼티 Gopro Shorty 미니 셀카봉 삼각대 주식회사 가게' '스몰리그 SR3232 후지 GFX 100S용 엘브라켓 주식회사 티에스아이시스템' '레오포토 Mr.Y 미스터와이 LY-224C + LH-25R 카본 삼각대 옐로우 (주)디카몰'
4	'소니 풀프레임 미러리스 카메라 알파 ILCE - 7M4 바디 / A7 IV / A7M4 (주)컴퓨존' '후지필름 X-T30 II XF18-55mm Kit 공식대리점 X-T30II 18-55 블랙 (당일배송) 주식회사 이로운컴퍼니' '캐논정품 / EOS M200 렌즈미포함 / 남대문 현찬디지탈 블랙 현찬디지탈'
14	'씨에스타 가죽스트랩 RF12 (8Color) 다크 브라운 더35미리(the35mm)' 'K&F CONCEPT KF13.115V1 블랙 이중버클 퀵릴리즈 넥스트랩 자동차 안전벨트 소재 그레이 (KF13.115) (주)아이라이징' '[ARTISAN&ARTIST] ACAM-25 OLIVE (주)컴퓨존'
8	'인스탁스 미니필름 마카롱1팩(10장) 캐릭터필름 /폴라로이드필름 인스탁스 미니필름 마카롱1팩(10장) 필름스튜디오' '후지필름 인스탁스 미니11 미니12 미니에보 전용 미니필름 1P(10매) 선물set /오늘주문 주식회사 제이에스헤럴드나인' '인스탁스 캐릭터 스퀘어필름(모노크롬)+포토라인/폴라로이드 SQ1 SQ6 10 20 40 쉐어 스퀘어필름 모노크롬 1팩(10장)+포토라인 글로리스(주)'
0	'니콘 D5500 바디만 정품 샤인프라자' '캐논 EOS 200D II BODY (블랙) DSLR카메라 오.케이.굳 주식회사' '캐논정품 / EOS 5D Mark IV / 렌즈미포함 / 남대문 현찬디지탈 현찬디지탈'
6	'DJI 액션3 스탠더드 콤보 (액션 카메라 4K 초광각 FOV 휴대성 웨어러블 고속충전) 대원씨티에스(주)' '포팩트 4FACT NT20 주식회사 렉스쿨컴퍼니' '[ ] 트랜센드 바디캠 DrivePro Body 30 ( 보안캠 경찰 소방관 안전 산업재해 ) 30000 mAh 대용량 보조배터리 (주)유아이커머스'
12	'로우프로 프로택틱 백팩 350 AW II (친환경소재/새로운라인) (주)디에스엘알스토어' 'Billingham Hadley Small Pro / 네이비쵸코 / 빌링햄 / 카메라백 / 세기정품 엠더블유 플랫폼(MW Platform)' '로우프로 패스트팩 프로 250 AW III 백팩 (그레이) 지오엔스토어'
11	'DJI Mic 2 무선 마이크 (2 TX + 1 RX + 충전 케이스) (FCC) 대원씨티에스(주)' '열림에이브이 국내조립 포니콘루페(블랙/그린/노랑) 10X/ 니콘루페/필름색판정/ 곤충식물 관찰자연확대경/사각루페/ 숲관찰/ 숲체험/ 환경체험 어린이선물 유치원교구 수입유리렌즈_포니콘블랙루페 열림AV' 'for 니콘루페 10X 휴대용 미니 돋보기 필름확대 목걸이타입 어린이집 유치원 교보재 포커스루페 포커스엠제이'
2	'겐코 AIR UV 52mm 슬림 렌즈 필터 UV코팅 주식회사 앤엑스라인' '호야 Sparkle 52mm 스파클 6X 크로스 필터 포인트광원 포토하우스' '호야 WIDE CPL필터 52mm 일출포토테크닉'
15	'HDR-CX405 정품 미니핸드캠 FULL HD캠코더 와이지스토어(주) (YG store Co., Ltd)' '파나소닉 AG-CX10 4K HD라이브스트리밍/캠코더 주식회사 센스포켓(sens pocket)' '파나소닉 프로페셔널 캠코더 HC-X1500 /4K/UHD/60FPS/광학24배/방송용 주식회사 무한미디어'
16	'[Elgato] Key Light 엘가토 키 라이트 제니스' '레이저코리아 Ring light 링 라이트 YT 주식회사 옐로우트리' '고독스 LED 조명 소형 휴대용 색 온도 조절 데스크탑 탁상용 LC30Bi 주식회사 센스포켓(sens pocket)'
3	'트랜센드 SDHC Class10 600X UHS-1 8GB (주)유아이커머스' '삼성전자 삼성 공식인증 마이크로 SD카드 PRO ENDURANCE 32GB MB-MJ32KA/APC 메모리카드 보관함케이스 주식회사 트라오' '(트랜센드) CF 133X 2GB 정품 밀알시스템'
7	'(리안)파워샷 G7X Mark II/정품 주식회사 리안' '리코정품/ GR IIIx / GR3x / 단품 /남대문 현찬디지탈 현찬디지탈' '리코GR3 스트리트 에디션 RICOH GR III Street Edition 어썸팩토리(awesome factory)'
17	'[개수제한 없음] 코닥 컬러플러스 200/36 2024-2025 kodak colorplus 200 컬러네거티브 36장 컬러필름 입문용필름 저스트픽쳐(Just picture)' '코닥필름 포트라 PORTRA 160 135-36 1롤 프로용 네가티브필름 코닥 포트라 160 135-36 [1롤] 필름스튜디오' '10롤1세트-후지 컬러 네가티브 C200 후속 필름 200/36(수동필름/SO200/입문용)-24년11월 이터너블 (eternovel)'
9	'파나소닉 에네루프 BQ-CC55 신형 급속충전기 AA/AAA 배터리케이스 제공 파나소닉 신형충전기 BQ-CC55 미래테크' '캐논 LP-E8 호환배터리 EOS 550D 전용배터리 주식회사 에스에이치몰' '후지 NP-45/45A 호환 배터리 FinePix JX200 J40 주식회사 위너스클럽'
10	'카리미/9723TC-OTG 블랙박스 멀티 SD카드 리더기 넷트루' 'USB3.0 올인원 카드리더기 NEXT-9703U3 엠스타샵' '엑토 C타입 USB 3.2 Gen1 OTG 멀티 카드리더기 CRD-44 (주)신진교역'
13	'캐논 EF-S 18-135mm F3.5-5.6 IS USM / DN 디지탈나라' '후지필름 GF110mm F2 R LM WR 온라인대리점 구매가능 주식회사 제이에스헤럴드나인' '탐론 18-200 F3.5-6.3 Di II VC B018 캐논용 주식회사 엔터커머스'

Evaluation

Metrics

Label	Metric
all	0.8190

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el20")
# Run inference
preds = model("185CM 카메라 스마트폰 삼각대 SEL-ML185K  주식회사 셀루미")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	9.9389	25

Label	Training Sample Count
0	50
1	50
2	50
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0067	1	0.4972	-
0.3356	50	0.3162	-
0.6711	100	0.178	-
1.0067	150	0.1148	-
1.3423	200	0.0596	-
1.6779	250	0.0503	-
2.0134	300	0.0288	-
2.3490	350	0.03	-
2.6846	400	0.0227	-
3.0201	450	0.0219	-
3.3557	500	0.022	-
3.6913	550	0.0127	-
4.0268	600	0.007	-
4.3624	650	0.0098	-
4.6980	700	0.0037	-
5.0336	750	0.0044	-
5.3691	800	0.0041	-
5.7047	850	0.0003	-
6.0403	900	0.0022	-
6.3758	950	0.0002	-
6.7114	1000	0.0053	-
7.0470	1050	0.0006	-
7.3826	1100	0.0006	-
7.7181	1150	0.0003	-
8.0537	1200	0.0002	-
8.3893	1250	0.0002	-
8.7248	1300	0.0002	-
9.0604	1350	0.0002	-
9.3960	1400	0.0002	-
9.7315	1450	0.0001	-
10.0671	1500	0.0002	-
10.4027	1550	0.0002	-
10.7383	1600	0.0001	-
11.0738	1650	0.0002	-
11.4094	1700	0.0001	-
11.7450	1750	0.0001	-
12.0805	1800	0.0001	-
12.4161	1850	0.0001	-
12.7517	1900	0.0001	-
13.0872	1950	0.0001	-
13.4228	2000	0.0001	-
13.7584	2050	0.0001	-
14.0940	2100	0.0001	-
14.4295	2150	0.0001	-
14.7651	2200	0.0001	-
15.1007	2250	0.0001	-
15.4362	2300	0.0001	-
15.7718	2350	0.0001	-
16.1074	2400	0.0001	-
16.4430	2450	0.0001	-
16.7785	2500	0.0001	-
17.1141	2550	0.0001	-
17.4497	2600	0.0001	-
17.7852	2650	0.0001	-
18.1208	2700	0.0001	-
18.4564	2750	0.0001	-
18.7919	2800	0.0001	-
19.1275	2850	0.0001	-
19.4631	2900	0.0001	-
19.7987	2950	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

Label	Training Sample Count
0	50
1	50
2	50
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Label	Training Sample Count
0	50
1	50
2	50
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50

Label	Training Sample Count
0	50
1	50
2	50
3	50
4	50
5	50
6	50
7	50
8	50
9	50
10	50
11	50
12	50
13	50
14	50
15	50
16	50
17	50
18	50