Update README.md
Browse files
README.md
CHANGED
|
@@ -12,14 +12,14 @@ language:
|
|
| 12 |
**TEST:** [`Live/Canlı Test`](https://huggingface.co/spaces/cagrigungor/turkishtoxic)
|
| 13 |
|
| 14 |
**Model ID:** [`cagrigungor/turkishtoxic-classifier`](https://huggingface.co/cagrigungor/turkishtoxic-classifier)
|
| 15 |
-
**Model Type:**
|
| 16 |
**Task:** Toxic / Non-Toxic Text Classification (Türkçe metinlerde toksisite tespiti)
|
| 17 |
|
| 18 |
---
|
| 19 |
|
| 20 |
## Overview
|
| 21 |
|
| 22 |
-
Bu model, tamamen sıfırdan eğitilmiş Türkçe bir **
|
| 23 |
Amaç, bir metnin küfür, hakaret, nefret söylemi gibi toksik içerik taşıyıp taşımadığını belirlemektir.
|
| 24 |
|
| 25 |
Model, Türkçe doğal dil işleme (NLP) alanında açık kaynak olarak geliştirilen bir projenin parçasıdır
|
|
@@ -31,7 +31,7 @@ ve içerik güvenliği, moderasyon sistemleri veya sosyal medya metin analizi gi
|
|
| 31 |
|
| 32 |
| Parametre | Değer |
|
| 33 |
|------------|--------|
|
| 34 |
-
| **Base Architecture** |
|
| 35 |
| **Tokenizer** | SentencePiece (32,005 kelime) |
|
| 36 |
| **Corpus Size** | 17M+ Türkçe cümle |
|
| 37 |
| **Pretraining Objective** | Masked Language Modeling (MLM) |
|
|
|
|
| 12 |
**TEST:** [`Live/Canlı Test`](https://huggingface.co/spaces/cagrigungor/turkishtoxic)
|
| 13 |
|
| 14 |
**Model ID:** [`cagrigungor/turkishtoxic-classifier`](https://huggingface.co/cagrigungor/turkishtoxic-classifier)
|
| 15 |
+
**Model Type:** Classification
|
| 16 |
**Task:** Toxic / Non-Toxic Text Classification (Türkçe metinlerde toksisite tespiti)
|
| 17 |
|
| 18 |
---
|
| 19 |
|
| 20 |
## Overview
|
| 21 |
|
| 22 |
+
Bu model, tamamen sıfırdan eğitilmiş Türkçe bir **toksisite sınıflandırıcısıdır**.
|
| 23 |
Amaç, bir metnin küfür, hakaret, nefret söylemi gibi toksik içerik taşıyıp taşımadığını belirlemektir.
|
| 24 |
|
| 25 |
Model, Türkçe doğal dil işleme (NLP) alanında açık kaynak olarak geliştirilen bir projenin parçasıdır
|
|
|
|
| 31 |
|
| 32 |
| Parametre | Değer |
|
| 33 |
|------------|--------|
|
| 34 |
+
| **Base Architecture** | (12 katman, 512 gizli boyut, 8 dikkat başlığı) |
|
| 35 |
| **Tokenizer** | SentencePiece (32,005 kelime) |
|
| 36 |
| **Corpus Size** | 17M+ Türkçe cümle |
|
| 37 |
| **Pretraining Objective** | Masked Language Modeling (MLM) |
|