MY_FIRST_RL / README.md
PixN's picture
IT'S NOT JUST A QUANTIZED MODEL OKAY????????
482cb80 verified
---
language:
- en
base_model:
- unsloth/Qwen3-4B-Base
---
# ⚠️This model isn't just a quantized model of unsloth/Qwen3-4B-Base
冬休みの自由研究としてUnslothのGRPOを使ってトレーニングしたQwen3-4B-Baseモデル。数学推論に特化させた…つもりなだけで実際はあんまりうまく動作しない。