ShogoMu
/

qwen25_7b_lora_agentbench_v6_e4

Text Generation

text-generation-inference

Model card Files Files and versions

ShogoMu commited on Feb 28

Commit

f16a136

·

verified ·

1 Parent(s): 92b209c

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -38,7 +38,7 @@ action selection, and error recovery.
 - **Base model:** Qwen/Qwen2.5-7B-Instruct
 - **Method:** LoRA (merged post-training)
 - **Max sequence length:** 2048
-- **Epochs:** 3
 - **Learning rate:** 2e-06
 - **LoRA Parameters:** r=64, alpha=128

 - **Base model:** Qwen/Qwen2.5-7B-Instruct
 - **Method:** LoRA (merged post-training)
 - **Max sequence length:** 2048
+- **Epochs:** 4
 - **Learning rate:** 2e-06
 - **LoRA Parameters:** r=64, alpha=128