max-rl
/

maze_17x17_sft_bs256_checkpoints

Reinforcement Learning

Model card Files Files and versions

maze_17x17_sft_bs256_checkpoints

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

guanning's picture

add bs256_shortest run (init_model + ckpt-250..ckpt-3000)

04af76a verified 28 days ago