--- language: - en base_model: - unsloth/Qwen3-4B-Base --- # ⚠️This model isn't just a quantized model of unsloth/Qwen3-4B-Base 冬休みの自由研究としてUnslothのGRPOを使ってトレーニングしたQwen3-4B-Baseモデル。数学推論に特化させた…つもりなだけで実際はあんまりうまく動作しない。