---
library_name: transformers
tags:
- turkish
- toxic
license: apache-2.0
language:
- tr
---
# Turkish Toxic Comment Classifier

**TEST:**  [`Live/Canlı Test`](https://huggingface.co/spaces/cagrigungor/turkishtoxic) 

**Model ID:** [`cagrigungor/turkishtoxic-classifier`](https://huggingface.co/cagrigungor/turkishtoxic-classifier)  
**Model Type:** Classification
**Task:** Toxic / Non-Toxic Text Classification (Türkçe metinlerde toksisite tespiti)

---

## Overview

Bu model, tamamen sıfırdan eğitilmiş Türkçe bir **toksisite sınıflandırıcısıdır**.  
Amaç, bir metnin küfür, hakaret, nefret söylemi gibi toksik içerik taşıyıp taşımadığını belirlemektir.  

Model, Türkçe doğal dil işleme (NLP) alanında açık kaynak olarak geliştirilen bir projenin parçasıdır  
ve içerik güvenliği, moderasyon sistemleri veya sosyal medya metin analizi gibi alanlarda kullanılabilir.

---

##  Training Details

| Parametre | Değer |
|------------|--------|
| **Base Architecture** |  (12 katman, 512 gizli boyut, 8 dikkat başlığı) |
| **Tokenizer** | SentencePiece (32,005 kelime) |
| **Corpus Size** | 17M+ Türkçe cümle |
| **Pretraining Objective** | Masked Language Modeling (MLM) |
| **Downstream Task** | Toxic Comment Classification |
| **Training Samples** | 100K Türkçe yorum |
| **Accuracy (Validation)** | 0.9389 |
| **F1 (Macro)** | 0.9385 |
| **Max Sequence Length** | 256 |
| **Optimizer** | AdamW |
| **Learning Rate** | 3e-5 |
| **Epochs** | 3 |
| **Batch Size** | 64 |

---

##  Labels

| Label | Açıklama |
|--------|-----------|
| `toxic` | Küfür, hakaret veya saldırgan dil içeren metin |
| `notoxic` | Tarafsız, olumlu veya bilgilendirici metin |

---

##  Quick Usage

Modeli doğrudan `transformers.pipeline` ile yükleyip test edebilirsiniz:

```python
from transformers import pipeline

# Modeli yükle
clf = pipeline("text-classification", model="cagrigungor/turkishtoxic-classifier")

# Tek örnek testi
print(clf("bugün hava çok güzel."))
```

Expected Output:

[{'label': 'notoxic', 'score': 0.992}] You can also test multiple sentences at once: