p1atdev's picture
Create README.md
4dda180 verified
|
raw
history blame
381 Bytes
metadata
base_model:
  - llm-jp/llm-jp-3-3.7b-instruct2
license: apache-2.0
datasets:
  - p1atdev/gsm8k-ja-slim
language:
  - ja
library_name: transformers
tags:
  - grpo
  - trl

additional instruction:

回答する際は、思考過程を<think></think>ブロック内に記述し、最終的な答えを数値のみで<answer></answer>ブロック内に記述してください。