Ctrl+K
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz128
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz16
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz256
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz32
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz512
- Llama-3.2-3B-Instruct-polaris-GRPO--bsz64
- Qwen2.5-3B-Instruct-polaris-AdamW-GRPO
- global_step_124
- global_step_186
- global_step_248
- global_step_310
- global_step_372
- kfac_out
- models
- synthetic
- 11.2 kB
- 3 Bytes