matutake / README.md
summerMC's picture
Update README.md
358a0bc verified
|
Raw
History Blame Contribute Delete
8.69 kB
---
language:
- ja
- en
base_model:
- summerMC/Sakura
base_model_relation: finetune
pipeline_tag: text-generation
library_name: transformers
tags:
- japanese
- chat
- sft
- causal-lm
- conversational
- reasoning
- fable
datasets:
- summerMC/v-Fable
---
# matutake
`matutake` は、[summerMC/Sakura](https://huggingface.co/summerMC/Sakura) をベースに、[summerMC/v-Fable](https://huggingface.co/datasets/summerMC/v-Fable) を用いて **Supervised Fine-Tuning (SFT)** した、日本語寄りの **Fable系対話・推論モデル** です。
このモデルは、coding専用モデルではなく、**会話・説明・推論・ロールプレイ・長めの応答生成** などを含む、Fable系のスタイルと応答傾向をSakura上で再現・適応することを目的に調整しています。
---
# 1. Model Overview
## 概要
* **Model name**: `summerMC/matutake`
* **Base model**: `summerMC/Sakura`
* **Training type**: Full fine-tuning / SFT
* **Primary dataset**: `summerMC/v-Fable`
## 主な目的
* 日本語での自然な会話応答
* Fable系の応答スタイルへの適応
* 長めの説明・推論応答の強化
* instruction following の改善
* 対話形式での安定した文章生成
`matutake` は、Fable系トレースデータをもとに、**対話の流れを保ちながら自然に返答する能力****ある程度まとまった推論や説明を返す能力****ロールや文脈に沿った返答を行う能力** を強めることを目的としています。
---
# 2. Intended Use
## 想定ユースケース
このモデルは、以下のような **一般的な対話・生成タスク** を想定しています。
### Chat / Conversation
* 日本語での雑談・対話
* 指示に従った応答生成
* 長めの会話文・返答文の生成
* キャラクターや口調を意識した会話
### Reasoning / Explanation
* 質問に対する段階的な説明
* 要点整理
* 比較・整理・要約
* ある程度長い推論を伴う返答
### Creative / Roleplay style generation
* Fable系の会話スタイル再現
* ロールプレイ風の返答
* 雰囲気重視の会話生成
* ストーリー寄りの応答や表現
### General instruction following
* 日本語プロンプトに対する自然な応答
* 情報整理
* 文章生成
* 口調や形式を指定した出力
---
# 3. Training Data
本モデルは主に以下のデータセットで学習されています。
## Dataset
* **`summerMC/v-Fable`**
`v-Fable` は Fable系トレースをもとにした対話・推論・スタイル応答を含むデータセットであり、会話の流れ、応答形式、説明調の返答、Fable系の雰囲気を持つ出力を学習するために使用しています。
学習時には主に `context -> completion` 形式を用い、与えられた文脈に対する応答全体をSFTしています。
### 主な特徴
* 対話形式の応答
* reasoning / explanation を含む返答
* Fable系のスタイルや雰囲気を持つ出力
* instruction-following と会話継続の両方を含む構成
---
# 4. Training Method
## Fine-tuning
* **方式**: Supervised Fine-Tuning (SFT)
* **学習対象**: base model の全パラメータ(full fine-tune)
* **目的**:
* Fable系の応答傾向への適応
* 会話の自然さの改善
* 長めの返答や説明の安定化
* 日本語での instruction following の向上
## 学習方針
本モデルでは、単純な短文応答よりも、以下のような性質を重視しています。
* 文脈を踏まえて返答する
* 長めの説明や会話を破綻しにくくする
* Fable系の話し方・返答傾向を反映する
* 日本語での自然な対話を強化する
---
# 5. Prompting / Chat Format
このモデルは **chat形式** の入力を想定しています。
ベースモデル `Sakura` のテンプレートに依存するため、基本的には `tokenizer.apply_chat_template(...)` を使うことを推奨します。
## Transformers example
```python
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
model_id = "summerMC/matutake"
tokenizer = AutoTokenizer.from_pretrained(
model_id,
trust_remote_code=True,
)
model = AutoModelForCausalLM.from_pretrained(
model_id,
trust_remote_code=True,
torch_dtype=torch.bfloat16,
device_map="auto",
)
messages = [
{
"role": "system",
"content": "You are matutake, a helpful Japanese conversational assistant."
},
{
"role": "user",
"content": "最近ちょっと疲れてるんだけど、少し気分が軽くなるように話して。"
}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
inputs = tokenizer(text, return_tensors="pt").to(model.device)
with torch.no_grad():
outputs = model.generate(
**inputs,
max_new_tokens=512,
do_sample=True,
temperature=0.7,
top_p=0.9,
repetition_penalty=1.05,
)
print(tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:], skip_special_tokens=True))
```
---
# 6. Recommended Generation Settings
用途が会話・説明・Fable系の返答寄りなので、まずは以下を推奨します。
## 会話向け
```python
max_new_tokens = 512
do_sample = True
temperature = 0.7
top_p = 0.9
repetition_penalty = 1.05
```
## 少し安定寄りにする場合
```python
max_new_tokens = 512
do_sample = True
temperature = 0.5
top_p = 0.9
repetition_penalty = 1.05
```
## 長めの応答を書かせる場合
```python
max_new_tokens = 1024
temperature = 0.7
top_p = 0.95
```
---
# 7. Example Prompts
## 日常会話
* `最近ちょっと気分が落ちてるから、少し優しく話してほしい。`
* `今日あったことを聞いてほしい。`
## 説明・整理
* `量子コンピュータって何か、中学生にもわかるように説明して。`
* `この文章を3行で要約して。`
## ロールプレイ / 雰囲気重視
* `落ち着いた口調で、夜に話しかけるような感じで返して。`
* `少し物語っぽい雰囲気で励まして。`
## 推論・長文応答
* `A案とB案のメリット・デメリットを比較して整理して。`
* `この悩みに対して、考え方を段階的に整理してほしい。`
---
# 8. Limitations
このモデルは**研究・実験用途**です。以下の制約があります。
* 事実性は保証されません
* 説明がもっともらしくても誤っている場合があります
* 長い応答では一貫性が崩れることがあります
* Fable系のスタイルに寄ることで、必要以上に感情的・演出的な返答になる場合があります
* chain-of-thought風の出力や冗長な説明が出ることがあります
**重要な判断に使う場合は、必ず人間が内容を確認してください。**
---
# 9. Safety / Responsible Use
以下の用途には適しません。
* 医療・法務・金融など高リスク分野の最終判断
* 人の状態に関する重大な判断の自動化
* 真偽確認なしでの事実情報の利用
* セーフティ確認なしの本番自動応答
モデルの出力は参考情報として扱い、必要に応じて別ソースで確認してください。
---
# 10. License
## Important
このモデルの利用条件は、**ベースモデル `summerMC/Sakura` のライセンス** および **学習データ `summerMC/v-Fable` のライセンス** に依存します。
利用前に必ずそれぞれの配布ページを確認してください。
* Base model: `summerMC/Sakura`
* Dataset: `summerMC/v-Fable`
特に、学習データに由来するライセンス・利用条件・再配布条件には注意してください。
---
# 11. Citation
もしこのモデルや派生物を研究・検証に利用した場合は、ベースモデルと学習データのクレジットも併記してください。
```bibtex
@misc{matutake2026,
title = {matutake},
author = {summerMC},
year = {2026},
howpublished = {\url{https://huggingface.co/summerMC/matutake}}
}
```
必要に応じて、ベースモデル・データセットの引用も追加してください。
---
# 12. Notes
`matutake` は、Sakura系列をベースに **Fable系の会話・推論・スタイル応答** を強化するための実験モデルです。
ベンチマークスコアの最適化よりも、**会話としての自然さ、返答の雰囲気、長めの応答生成** を重視しています。