MeowFR
/

mistral-7b-humanization-grpo

Reinforcement Learning

Model card Files Files and versions

mistral-7b-humanization-grpo / tokenizer.json

MeowFR's picture

Step 100 MA=0.712

ecec553 verified 22 days ago

history contribute delete

3.51 MB

File too large to display, you can check the raw version instead.