wuschelschulz
/

gemma_1_reasoning_reward_hacking_SFT_debug

Model card Files Files and versions

gemma_1_reasoning_reward_hacking_SFT_debug

2.48 GB

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

wuschelschulz's picture

Upload model

6df573d verified 7 months ago