| # これはなに? | |
| `stabilityai/japanese-stablelm-base-alpha-7b` を `rosebleu` データセットで学習した Lora | |
| ## 使い方 | |
| .\text-generation-webui\loras\Rosebleu となるように配置。 | |
| `text-generation-webui` の `model` の LoRAから読み込める。 | |
| ## データセット | |
| https://gitlab.com/open_contents_datasets/Rosebleu | |
| Hシーンも含まれているみたいですが、特に区別せずに突っ込んでいます。 | |
| ## 前処理とデータロード | |
| 中にあるすべてのtsvを全部繋て、csvにしただけ。 | |
| 学習プロンプトはこの用にしているので、このフォーマットだと良くなったりすることがあるかもしれないし、ないかもしれない。 | |
| コンテキスト長は2048にしているので、1行が2048トークン以上は切り捨てられているはず。 | |
| ``` | |
| result = f'### name:\n{data_point["name"]}\n\n### text:\n{data_point["text"]}' | |
| ``` |