AlignmentResearch
/

pineapple-policy-oskar_006b_grpo_training

Model card Files Files and versions

pineapple-policy-oskar_006b_grpo_training / tokenizer.json

Commit History

Upload trained grpo model

5fd8d55
verified

skar0 commited on Jul 9, 2025