arvindcr4
/

tinker-rl-arithmetic_trajectory-llama-3.2-1b

Reinforcement Learning

Model card Files Files and versions

tinker-rl-arithmetic_trajectory-llama-3.2-1b / final

107 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

arvindcr4's picture

Upload 6 Tinker checkpoint(s) from 39aa5eb2-e234-5a95-ab68-896e4cac8c45

ccd557c verified about 1 month ago

adapter_config.json

736 Bytes
Upload 6 Tinker checkpoint(s) from 39aa5eb2-e234-5a95-ab68-896e4cac8c45 about 1 month ago
adapter_model.safetensors

107 MB
xet

Upload 6 Tinker checkpoint(s) from 39aa5eb2-e234-5a95-ab68-896e4cac8c45 about 1 month ago
checkpoint_complete

0 Bytes
Upload 6 Tinker checkpoint(s) from 39aa5eb2-e234-5a95-ab68-896e4cac8c45 about 1 month ago