TTA-DQA
/

HateDetection_MultiLabel_KcElectra_FineTuning

Text-Classification

Multi-Label-Classification

Model card Files Files and versions

HateDetection_MultiLabel_KcElectra_FineTuning / README.md

TTA-DQA's picture

Update README.md

957ef54 verified 9 months ago

|

history blame contribute delete

3.08 kB

	---
	license: mit
	datasets:
	- TTA-DQA/hate_sentence
	language:
	- ko
	metrics:
	- accuracy
	- f1
	base_model:
	- beomi/KcELECTRA-base-v2022
	tags:
	- Text-Classification
	- Multi-Label-Classification
	---
	### 📌 모델 상세 정보
	## 1. 🧾 개요

	이 모델은 한국어 문장 내 유해 표현의 유무 및 유해 표현의 유형(카테고리)를 분류하기 위해 학습된 모델입니다.
	`mult-label classification`을 수행하며, 유해표현이 포함되는지, 유해표현이라면 그 유형을 판단(분류) 합니다.
	AI-Task로는 `text-classification`에 해당합니다.
	사용하는 데이터셋은 [`TTA-DQA/hate_sentence`](https://huggingface.co/datasets/TTA-DQA/hate_sentence)입니다.

	- 클래스 구성:
	- `"0"`: `insult`
	- `"1"`: `abuse`
	- `"2"`: `obscenity`
	- `"3"`: `TVPC(Threats of violence/promotion of crime)`
	- `"4"`: `sexuality`
	- `"5"`: `age`
	- `"6"`: `race and region`
	- `"7"`: `disabled`
	- `"8"`: `religion`
	- `"9"`: `politics`
	- `"10"`: `job`
	- `"11"`: `no_hate`
	---
	## 2. 🧠 학습 정보

	- Base Model: KcElectra (a pre-trained Korean language model based on Electra)
	- Source: [beomi/KcELECTRA](https://huggingface.co/beomi/KcELECTRA-base-v2022)
	- Model Type: Casual Language Model
	- Pre-training (Korean): 약 17GB (over 180 million sentences)
	- Fine-tuning (Hate Dataset): 약 22.3MB (`TTA-DQA/hate_sentence`)
	- Learning Rate: `5e-6`
	- Weight Decay: `0.01`
	- Epochs: `30`
	- Batch Size: `16`
	- Data Loader Workers: `2`
	- Tokenizer: `BertWordPieceTokenizer`
	- Model Size: 약 `511MB`

	---

	## 3. 🧩 요구사항

	- `pytorch ~= 1.8.0`
	- `transformers ~= 4.0.0`
	- `emoji ~= 0.6.0`
	- `soynlp ~= 0.0.493`

	---

	## 4. 🚀 Quick Start

	```python
	from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline

	model_name = "TTA-DQA/HateDetection_MultiLabel_KcElectra_FineTuning"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForSequenceClassification.from_pretrained(model_name)
	classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)

	sentences = ["오늘 점심 뭐 먹을까?", "이 나쁜 놈아."]
	results = classifier(sentences)'
	```

	---

	## 5.📚 Citation
	이 모델은 초거대AI 학습용 데이터 품질검증 사업(2024년도 초거대AI 학습용 품질검증)에 의해서 구축되었습니다.

	---

	## 6. ⚠️ Bias, Risks, and Limitations

	본 모델은 각 클래스의 데이터를 편향되게 학습하지는 않았으나,
	언어적·문화적 특성에 의해 레이블에 대한 이견이 있을 수 있습니다.
	유해 표현은 언어, 문화, 적용 분야, 개인적 견해에 따라 주관적인 부분이 존재하여,
	결과에 대한 편향 또는 논란이 발생할 수 있습니다.

	> ❗ 본 모델의 결과는 절대적인 유해 표현 기준이 아님을 유의해 주세요.

	---

	# 📈 Results
	- Task: binary classification (text-classification)
	- F1-score: 0.8279
	- Accuracy: 0.7013