AlignmentResearch
/

pineapple-policy-oskar_006a_grpo_training

Model card Files Files and versions

pineapple-policy-oskar_006a_grpo_training / tokenizer.json

Commit History

Upload trained grpo model

c13ff8c
verified

skar0 commited on Jun 19, 2025