Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
Log In
Sign Up

hyan
/

grpo_reasoning_model

Generated from Trainer

Model card Files Files and versions

grpo_reasoning_model

13.6 MB

1 contributor

History: 6 commits

hyan's picture

Training in progress, step 500

3e5eeee verified 27 days ago

.gitattributes
1.57 kB

Training in progress, step 100 27 days ago
README.md
2.2 kB

Training in progress, step 100 27 days ago
adapter_config.json
1.01 kB

Training in progress, step 100 27 days ago
adapter_model.safetensors
2.19 MB
xet

Training in progress, step 500 27 days ago
chat_template.jinja
2.51 kB

Training in progress, step 100 27 days ago
tokenizer.json
11.4 MB
xet

Training in progress, step 100 27 days ago
tokenizer_config.json
665 Bytes

Training in progress, step 100 27 days ago
training_args.bin
6.93 kB
xet

Training in progress, step 100 27 days ago