MF0619
/

SFTv13

@@ -36,7 +36,9 @@ while intermediate reasoning (Chain-of-Thought) is masked.
 - Max sequence length: 2048
 - Epochs: 3
 - Learning rate: 1e-06
-- LoRA: r=64, alpha=128
 ## Usage
@@ -46,7 +48,7 @@ from peft import PeftModel
 import torch
 base = "Qwen/Qwen3-4B-Instruct-2507"
-adapter = "your_id/your-repo"
 tokenizer = AutoTokenizer.from_pretrained(base)
 model = AutoModelForCausalLM.from_pretrained(

 - Max sequence length: 2048
 - Epochs: 3
 - Learning rate: 1e-06
+- Weight decay: 0.05
+- Warmup ratio: 0.1
+- LoRA: r=64, alpha=128, dropout=0
 ## Usage
 import torch
 base = "Qwen/Qwen3-4B-Instruct-2507"
+adapter = "MF0619/SFTv13"
 tokenizer = AutoTokenizer.from_pretrained(base)
 model = AutoModelForCausalLM.from_pretrained(