Anna4242
/

Qwen2.5-instruct-rl-only

Model card Files Files and versions

Qwen2.5-instruct-rl-only / tokenizer.json

Commit History

Upload RL-trained model from outputs/nemotron-multihop-qwen2.5-7b-rl/final_model

9997bba
verified

Anna4242 commited on Nov 24, 2025