--- base_model: - llm-jp/llm-jp-3-3.7b-instruct2 license: apache-2.0 datasets: - p1atdev/gsm8k-ja-slim language: - ja library_name: transformers tags: - grpo - trl --- additional instruction: ``` 回答する際は、思考過程をブロック内に記述し、最終的な答えを数値のみでブロック内に記述してください。 ```