MeowFR
/

mistral-7b-humanization-grpo

Reinforcement Learning

Model card Files Files and versions

mistral-7b-humanization-grpo / tokenizer.model

Commit History

Step 100 MA=0.712

ecec553
verified

MeowFR commited on 20 days ago