Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,18 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
# これはなに?
|
| 2 |
+
`stabilityai/japanese-stablelm-base-alpha-7b` を `rosebleu` データセットで学習した Lora
|
| 3 |
+
|
| 4 |
+
## 使い方
|
| 5 |
+
.\text-generation-webui\loras\Rosebleu となるように配置。
|
| 6 |
+
`text-generation-webui` の `model` の LoRAから読み込める。
|
| 7 |
+
|
| 8 |
+
## データセット
|
| 9 |
+
https://gitlab.com/open_contents_datasets/Rosebleu
|
| 10 |
+
Hシーンも含まれているみたいですが、特に区別せずに突っ込んでいます。
|
| 11 |
+
|
| 12 |
+
## 前処理とデータロード
|
| 13 |
+
中にあるすべてのtsvを全部繋て、csvにしただけ。
|
| 14 |
+
学習プロンプトはこの用にしているので、このフォーマットだと良くなったりすることがあるかもしれないし、ないかもしれない。
|
| 15 |
+
コンテキスト長は2048にしているので、1行が2048トークン以上は切り捨てられているはず。
|
| 16 |
+
```
|
| 17 |
+
result = f'### name:\n{data_point["name"]}\n\n### text:\n{data_point["text"]}'
|
| 18 |
+
```
|