LBK95
/

grpo-OracleRM_Async_4responses_V1-adapter-v1

Generated from Trainer

Model card Files Files and versions

grpo-OracleRM_Async_4responses_V1-adapter-v1

1 contributor

History: 8 commits

LBK95's picture

Continue training same adapter (final push)

9e43038 verified about 2 months ago