sixfingerdev
/

kayra-1

Text Generation

instruction-tuning

Model card Files Files and versions

sixfingerdev commited on Dec 17, 2025

Commit

6d608fe

·

verified ·

1 Parent(s): 347533a

Update README.md

Files changed (1) hide show

README.md +5 -10

README.md CHANGED Viewed

@@ -8,9 +8,6 @@ tags:
 - llm
 - instruction-tuning
 - conversational
-datasets:
-- sixfingerdev/turkish-qa-multi-dialog-dataset
-base_model: sixfingerdev/kayra-1-exp
 ---
 # 🇹🇷 Kayra-Stable
@@ -20,8 +17,6 @@ base_model: sixfingerdev/kayra-1-exp
 ## 📊 Model Özellikleri
 - **Parametre Sayısı**: 85 Milyon
-- **Base Model**: kayra-1-exp (500K Türkçe doküman ile pretrained)
-- **Fine-tuning Dataset**: 21,282 Türkçe QA örneği
 - **Context Window**: 512 token
 - **Vocab Size**: 32,000
 - **Eğitim Süresi**: ~2 saat (T4 GPU)
@@ -35,7 +30,7 @@ base_model: sixfingerdev/kayra-1-exp
 | Factuality | ~%20 | ~%60 | ↑ 3x |
 ## 🚀 Kullanım
     from transformers import AutoModelForCausalLM, AutoTokenizer
     # Model yükle
@@ -50,7 +45,7 @@ base_model: sixfingerdev/kayra-1-exp
     outputs = model.generate(**inputs, max_new_tokens=100, temperature=0.2)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     print(response.split("### Cevap:")[-1].strip())
 ## ✅ Test Sonuçları
 - **Türkiye'nin başkenti?** → Ankara ✅
@@ -66,11 +61,11 @@ base_model: sixfingerdev/kayra-1-exp
 4. **Reasoning**: Karmaşık mantık yürütme zayıf
 ## 📝 Prompt Formatı
     ### Soru: {soru}
     ### Cevap: {model yanıtı}
 ## 🔮 V2 Roadmap
 1. ✅ Tokenizer düzeltme (NFC + Whitespace)
@@ -84,4 +79,4 @@ MIT License
 ---
-**Not**: Bu deneysel bir modeldir. Production kullanımı için test edilmelidir.

 - llm
 - instruction-tuning
 - conversational
 ---
 # 🇹🇷 Kayra-Stable
 ## 📊 Model Özellikleri
 - **Parametre Sayısı**: 85 Milyon
 - **Context Window**: 512 token
 - **Vocab Size**: 32,000
 - **Eğitim Süresi**: ~2 saat (T4 GPU)
 | Factuality | ~%20 | ~%60 | ↑ 3x |
 ## 🚀 Kullanım
+```
     from transformers import AutoModelForCausalLM, AutoTokenizer
     # Model yükle
     outputs = model.generate(**inputs, max_new_tokens=100, temperature=0.2)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     print(response.split("### Cevap:")[-1].strip())
+```
 ## ✅ Test Sonuçları
 - **Türkiye'nin başkenti?** → Ankara ✅
 4. **Reasoning**: Karmaşık mantık yürütme zayıf
 ## 📝 Prompt Formatı
+```
     ### Soru: {soru}
     ### Cevap: {model yanıtı}
+```
 ## 🔮 V2 Roadmap
 1. ✅ Tokenizer düzeltme (NFC + Whitespace)
 ---
+**Not**: Bu bir base modeldir. Production kullanımı için test edilmelidir.