cagrigungor commited on
Commit
2efa57b
·
verified ·
1 Parent(s): 948fe26

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -3
README.md CHANGED
@@ -12,14 +12,14 @@ language:
12
  **TEST:** [`Live/Canlı Test`](https://huggingface.co/spaces/cagrigungor/turkishtoxic)
13
 
14
  **Model ID:** [`cagrigungor/turkishtoxic-classifier`](https://huggingface.co/cagrigungor/turkishtoxic-classifier)
15
- **Model Type:** BERT (trained from scratch on Turkish corpus)
16
  **Task:** Toxic / Non-Toxic Text Classification (Türkçe metinlerde toksisite tespiti)
17
 
18
  ---
19
 
20
  ## Overview
21
 
22
- Bu model, tamamen sıfırdan eğitilmiş Türkçe bir **BERT tabanlı toksisite sınıflandırıcısıdır**.
23
  Amaç, bir metnin küfür, hakaret, nefret söylemi gibi toksik içerik taşıyıp taşımadığını belirlemektir.
24
 
25
  Model, Türkçe doğal dil işleme (NLP) alanında açık kaynak olarak geliştirilen bir projenin parçasıdır
@@ -31,7 +31,7 @@ ve içerik güvenliği, moderasyon sistemleri veya sosyal medya metin analizi gi
31
 
32
  | Parametre | Değer |
33
  |------------|--------|
34
- | **Base Architecture** | BERT (12 katman, 512 gizli boyut, 8 dikkat başlığı) |
35
  | **Tokenizer** | SentencePiece (32,005 kelime) |
36
  | **Corpus Size** | 17M+ Türkçe cümle |
37
  | **Pretraining Objective** | Masked Language Modeling (MLM) |
 
12
  **TEST:** [`Live/Canlı Test`](https://huggingface.co/spaces/cagrigungor/turkishtoxic)
13
 
14
  **Model ID:** [`cagrigungor/turkishtoxic-classifier`](https://huggingface.co/cagrigungor/turkishtoxic-classifier)
15
+ **Model Type:** Classification
16
  **Task:** Toxic / Non-Toxic Text Classification (Türkçe metinlerde toksisite tespiti)
17
 
18
  ---
19
 
20
  ## Overview
21
 
22
+ Bu model, tamamen sıfırdan eğitilmiş Türkçe bir **toksisite sınıflandırıcısıdır**.
23
  Amaç, bir metnin küfür, hakaret, nefret söylemi gibi toksik içerik taşıyıp taşımadığını belirlemektir.
24
 
25
  Model, Türkçe doğal dil işleme (NLP) alanında açık kaynak olarak geliştirilen bir projenin parçasıdır
 
31
 
32
  | Parametre | Değer |
33
  |------------|--------|
34
+ | **Base Architecture** | (12 katman, 512 gizli boyut, 8 dikkat başlığı) |
35
  | **Tokenizer** | SentencePiece (32,005 kelime) |
36
  | **Corpus Size** | 17M+ Türkçe cümle |
37
  | **Pretraining Objective** | Masked Language Modeling (MLM) |