| base_model: | |
| - llm-jp/llm-jp-3-3.7b-instruct2 | |
| license: apache-2.0 | |
| datasets: | |
| - p1atdev/gsm8k-ja-slim | |
| language: | |
| - ja | |
| library_name: transformers | |
| tags: | |
| - grpo | |
| - trl | |
| additional instruction: | |
| ``` | |
| 回答する際は、思考過程を<think></think>ブロック内に記述し、最終的な答えを数値のみで<answer></answer>ブロック内に記述してください。 | |
| ``` |