| language: | |
| - en | |
| base_model: | |
| - unsloth/Qwen3-4B-Base | |
| # ⚠️This model isn't just a quantized model of unsloth/Qwen3-4B-Base | |
| 冬休みの自由研究としてUnslothのGRPOを使ってトレーニングしたQwen3-4B-Baseモデル。数学推論に特化させた…つもりなだけで実際はあんまりうまく動作しない。 |
| language: | |
| - en | |
| base_model: | |
| - unsloth/Qwen3-4B-Base | |
| # ⚠️This model isn't just a quantized model of unsloth/Qwen3-4B-Base | |
| 冬休みの自由研究としてUnslothのGRPOを使ってトレーニングしたQwen3-4B-Baseモデル。数学推論に特化させた…つもりなだけで実際はあんまりうまく動作しない。 |