p1atdev's picture
Create README.md
4dda180 verified
|
raw
history blame
381 Bytes
---
base_model:
- llm-jp/llm-jp-3-3.7b-instruct2
license: apache-2.0
datasets:
- p1atdev/gsm8k-ja-slim
language:
- ja
library_name: transformers
tags:
- grpo
- trl
---
additional instruction:
```
回答する際は、思考過程を<think></think>ブロック内に記述し、最終的な答えを数値のみで<answer></answer>ブロック内に記述してください。
```