akashmaggon
/

LLAMA-0.5B-GRPO-RedditModerator

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

LLAMA-0.5B-GRPO-RedditModerator / runs

38.9 kB

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

akashmaggon's picture

Training in progress, step 100

ac096a8 verified 8 months ago

Aug15_05-41-18_8fb9de024d34
Training in progress, step 100 8 months ago