akashmaggon
/

LLAMA-0.5B-GRPO-RedditModerator

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

LLAMA-0.5B-GRPO-RedditModerator

Commit History

Training in progress, step 100

ac096a8
verified

akashmaggon commited on Aug 15, 2025

Training in progress, step 50

da26b78
verified

akashmaggon commited on Aug 15, 2025

initial commit

fe07994
verified

akashmaggon commited on Aug 15, 2025