akashmaggon
/

Qwen-4B-GRPO-RedditModerator

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen-4B-GRPO-RedditModerator / runs

158 kB

Ctrl+K

Ctrl+K

1 contributor

History: 37 commits

akashmaggon's picture

Training in progress, step 200

9a067d9 verified 7 months ago