AI & ML interests
None yet
Organizations
None yet
ihategetname/qwen2.5_0.5b_grpo3_agent1_B-sft-hard
0.5B • Updated • 1
ihategetname/qwen2.5_0.5b_grpo2_agent1_Halu_penalty
0.5B • Updated • 1
ihategetname/qwen2.5_0.5b_sft2_agent1_B-sft
0.5B • Updated • 1
ihategetname/qwen2.5_0.5b_grpo_agent2
0.5B • Updated ihategetname/qwen2.5_0.5b_sft_agent2
0.5B • Updated ihategetname/qwen2.5_0.5b_grpo3_agent1
0.5B • Updated • 3
ihategetname/qwen2.5_0.5b_grpo2_agent1
0.5B • Updated • 1
ihategetname/qwen2.5_0.5b_grpo1_agent1
0.5B • Updated • 1
ihategetname/qwen2.5_0.5b_sft1_agent1
Text Generation
• 0.5B • Updated ihategetname/qwen2.5_3b_sft1_agent1
Text Generation
• 242k • Updated ihategetname/qwen2.5_3b_sft2_agent1
3B • Updated • 2
ihategetname/qwen2.5_0.5b_sft2_agent1
0.5B • Updated