AlignmentResearch
/

pineapple-policy-oskar_006ba_grpo_training

Model card Files Files and versions

pineapple-policy-oskar_006ba_grpo_training / reference

42.1 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

skar0's picture

Upload trained grpo model

845c884 verified 9 months ago