AlignmentResearch
/

pineapple-policy-oskar_006c_grpo_training

Model card Files Files and versions

pineapple-policy-oskar_006c_grpo_training / tokenizer.json

Commit History

Upload trained grpo model

bf3e8f2
verified

skar0 commited on Jul 15, 2025