akashmaggon
/

LLAMA-0.5B-GRPO-RedditModerator

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

LLAMA-0.5B-GRPO-RedditModerator / tokenizer.json

Commit History

Training in progress, step 50

da26b78
verified

akashmaggon commited on Aug 15, 2025