EleutherAI
/

unsloth-phi-4-Instruct-LORA-Open-R1-Code-GRPO-b2-as4-lr2en5-vuln

Model card Files Files and versions

unsloth-phi-4-Instruct-LORA-Open-R1-Code-GRPO-b2-as4-lr2en5-vuln / training_args.bin

Commit History

Training in progress, step 950

1b9ef48
verified

davidoj01 commited on May 8, 2025

Training in progress, step 650

14a3d8a
verified

davidoj01 commited on May 5, 2025

Training in progress, step 250

0097db5
verified

davidoj01 commited on May 1, 2025

Training in progress, step 50

d3cc456
verified

davidoj01 commited on Apr 30, 2025

Training in progress, step 50

72d042c
verified

davidoj01 commited on Apr 29, 2025

Training in progress, step 300

bde1a6d
verified

davidoj01 commited on Apr 25, 2025

Training in progress, step 150

5cc7d99
verified

davidoj01 commited on Apr 23, 2025

Training in progress, step 50

964c926
verified

davidoj01 commited on Apr 22, 2025