| | --- |
| | license: apache-2.0 |
| | tags: |
| | - unsloth |
| | - trl |
| | - sft |
| | --- |
| | |
| | # DeepSeek-R1-Turkish-Dialog-Dataset |
| |
|
| | Türkçe doğal dil işleme (NLP) görevleri için hazırlanmış, çeşitli konu başlıklarını kapsayan diyalog veri seti. Bu veri seti, sohbet botları, dil modelleri ve diyalog sistemleri geliştirmek için kullanılabilir. |
| |
|
| | --- |
| |
|
| | ## 📌 Öne Çıkan Özellikler |
| | - **Geniş Kapsam**: Günlük sohbetler, teknik tartışmalar, kültürel konular ve daha fazlası. |
| | - **Doğal Dil Çeşitliliği**: Türkçe'nin günlük kullanımına uygun informal ifadeler ve resmi dil yapıları. |
| | - **Yapılandırılmış Format**: JSON, CSV veya TXT formatlarında temizlenmiş ve etiketlenmiş veri. |
| | - **Ölçeklenebilirlik**: 50.000+ diyalog çifti (örnek sayısı projeye göre güncellenebilir). |
| |
|
| | --- |
| |
|
| | ## 📂 Veri Seti Yapısı |
| | ### Örnek JSON Formatı: |
| | ```json |
| | { |
| | "dialog_id": "DLG-001", |
| | "context": ["Merhaba!", "Selam, nasılsın?"], |
| | "response": "İyiyim, teşekkür ederim. Sen nasılsın?", |
| | "topic": "günlük_sohbet", |
| | "source": "sentetik_veri", |
| | "lang": "tr" |
| | } |
| | |