hyunseoki
/

Qwen2.5-1.5B-Instruct-Open-R1-GRPO-test4

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Instruct-Open-R1-GRPO-test4

Commit History

Model save

4a8a065
verified

hyunseoki commited on Feb 6, 2025

Training in progress, step 267

2f40942
verified

hyunseoki commited on Feb 6, 2025

Training in progress, step 216

e71f91e
verified

hyunseoki commited on Feb 6, 2025

Training in progress, step 162

9bcc6fc
verified

hyunseoki commited on Feb 6, 2025

Training in progress, step 108

d815396
verified

hyunseoki commited on Feb 6, 2025

Training in progress, step 54

de4733e
verified

hyunseoki commited on Feb 6, 2025

initial commit

123954b
verified

hyunseoki commited on Feb 6, 2025