--- language: tr tags: - turkish - conspiracy-detection - bert - classification - text-classification - fine-tuned license: apache-2.0 datasets: - custom metrics: - accuracy - f1 - precision - recall model-index: - name: turkish-conspiracy-detection results: - task: type: text-classification name: Text Classification dataset: type: custom name: Turkish Conspiracy Detection Dataset metrics: - type: accuracy value: 0.9879 name: Accuracy - type: f1 value: 0.9879 name: F1 Score - type: precision value: 0.9879 name: Precision - type: recall value: 0.9879 name: Recall --- # Türkçe Komplo Teorisi Tespit Modeli Bu model, Türkçe metinlerde komplo teorisi tespiti yapmak için fine-tune edilmiş BERT tabanlı bir sınıflandırma modelidir. ## Model Detayları ### Model Açıklaması - **Geliştirici**: Metinimo19 - **Model Türü**: Text Classification (İkili Sınıflandırma) - **Dil**: Türkçe (tr) - **Temel Model**: [savasy/bert-base-turkish-sentiment-cased](https://huggingface.co/savasy/bert-base-turkish-sentiment-cased) - **Fine-tuning Görevi**: Komplo teorisi vs gerçek haber ayrımı - **Lisans**: Apache 2.0 ### Model Kaynakları - **Repository**: https://huggingface.co/Metinimo19/turkish-conspiracy-detection - **Temel Model**: https://huggingface.co/savasy/bert-base-turkish-sentiment-cased ## Kullanım ### Doğrudan Kullanım Model, Türkçe metinlerde komplo teorisi tespiti için kullanılabilir: ```python from transformers import AutoTokenizer, AutoModelForSequenceClassification import torch # Model ve tokenizer'ı yükle tokenizer = AutoTokenizer.from_pretrained("Metinimo19/turkish-conspiracy-detection") model = AutoModelForSequenceClassification.from_pretrained("Metinimo19/turkish-conspiracy-detection") # Örnek metin text = "5G teknolojisi insanları kontrol etmek için tasarlanmış gizli bir sistemdir." # Tahmin yap inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512) with torch.no_grad(): outputs = model(**inputs) predictions = torch.nn.functional.softmax(outputs.logits, dim=-1) predicted_class = torch.argmax(predictions, dim=-1).item() # Sonuç result = "Komplo Teorisi" if predicted_class == 1 else "Gerçek Haber" confidence = predictions[0][predicted_class].item() print(f"Tahmin: {result} (Güven: {confidence:.2%})") ``` ## Eğitim Detayları ### Eğitim Verisi - **Veri Seti Boyutu**: 1,651 Türkçe örnek - **Sınıf Dağılımı**: Dengeli (yaklaşık %50 gerçek haber, %50 komplo teorisi) - **Veri Türü**: Türkçe metinler (haberler, sosyal medya içerikleri, makale özetleri) ### Eğitim Prosedürü #### Eğitim Hiperparametreleri - **Batch Size**: 16 (train ve eval) - **Learning Rate**: 2e-5 - **Epochs**: 3 - **Warmup Steps**: 500 - **Weight Decay**: 0.01 - **Optimizer**: AdamW - **Mixed Precision**: FP16 (GPU kullanımında) #### Veri Bölünmesi - **Eğitim**: %70 (1,155 örnek) - **Doğrulama**: %15 (248 örnek) - **Test**: %15 (248 örnek) ## Değerlendirme ### Test Sonuçları Model test seti üzerinde şu performansı gösterdi: | Metrik | Değer | |--------|-------| | **Accuracy** | 0.9879 | | **F1 Score** | 0.9879 | | **Precision** | 0.9879 | | **Recall** | 0.9879 | ### Sınıf Tanımları - **0**: Gerçek Haber - Doğrulanabilir, güvenilir kaynaklardan gelen bilgiler - **1**: Komplo Teorisi - Kanıtlanmamış, spekülatif veya yanlış bilgiler ## Sınırlamalar ve Önyargılar ### Sınırlamalar - Model sadece Türkçe metinler için eğitilmiştir - 512 token uzunluğundaki metinlerle sınırlıdır - Eğitim verisinin boyutu nispeten küçüktür (1,651 örnek) - Belirli konularda (5G, aşı, uzaylılar vb.) daha fazla veri içerir ### Öneriler - Kritik kararlar için model çıktılarını tek başına kullanmayın - Sonuçları uzman değerlendirmesiyle destekleyin - Modelin sınırlarını göz önünde bulundurun ## Teknik Özellikler ### Model Mimarisi - **Temel Mimari**: BERT (Bidirectional Encoder Representations from Transformers) - **Parametre Sayısı**: ~110M parametre - **Sınıflandırma Katmanı**: Linear layer (768 → 2) - **Aktivasyon**: Softmax ### Hesaplama Altyapısı - **Eğitim Platformu**: Google Colab - **GPU**: Tesla T4 (16GB) - **Eğitim Süresi**: Yaklaşık 10-15 dakika - **Framework**: PyTorch + Transformers ## Nasıl Başlanır ```python from transformers import pipeline # Pipeline kullanarak basit kullanım classifier = pipeline("text-classification", model="Metinimo19/turkish-conspiracy-detection") result = classifier("Ay'a hiç çıkmadık, tüm görüntüler sahteydi.") print(result) ``` --- *Bu model, eğitim ve araştırma amaçları için geliştirilmiştir. Üretim ortamında kullanmadan önce kapsamlı testler yapılması önerilir.*