Realmbird
/

helpfulness-preference-model-qwen-0.6B

Generated from Trainer

Model card Files Files and versions

Realmbird commited on Aug 1, 2025

Commit

3ebcc51

·

verified ·

1 Parent(s): 8d7ce03

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -10,6 +10,7 @@ licence: license
 ---
 # Model Card for Qwen3.0-1.7B-Reward
 This model is a fine-tuned version of [Qwen/Qwen3-0.6B](https://huggingface.co/Qwen/Qwen3-0.6B).
 It has been trained using [TRL](https://github.com/huggingface/trl).

 ---
 # Model Card for Qwen3.0-1.7B-Reward
+Use https://huggingface.co/Realmbird/helpfulness-preference-model-qwen-0.6B-merged instead due to a tokenizer mismatch
 This model is a fine-tuned version of [Qwen/Qwen3-0.6B](https://huggingface.co/Qwen/Qwen3-0.6B).
 It has been trained using [TRL](https://github.com/huggingface/trl).