File size: 2,118 Bytes
77cc641
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
# 事前準備

[← README に戻る](../README.md)

## 1. Modal セットアップ

```bash
pip install modal
modal token new
```

## 2. Hugging Face シークレット(必須)

`modal_app.py` は Modal 上の secret 名 `hf_token`(キー: `HF_TOKEN`)を参照する。
既に作成済みであれば追加作業は不要。新規の場合:

```bash
modal secret create hf_token HF_TOKEN=hf_xxxxxxxxxxxxx
```

トークンは https://huggingface.co/settings/tokens で発行。Anima は public モデルなので
レート制限回避のために推奨。secret 名を変えたい場合は `modal_app.py``from_name("hf_token", ...)` を書き換える。

### HF Hub への upload (LoRA 配布など)

`hf_token` は read 専用のことが多い。配布 / repo 作成には別途 write 権限のトークンを
`HF_TOKEN_WRITE` secret で持たせる:

```bash
modal secret create HF_TOKEN_WRITE HF_TOKEN_WRITE=hf_xxxxxx_write_xxxxx
```

`modal_app.py``upload_lora_to_hf` がこの secret を参照する。

## 3. データセットの用意

Modal に上げる前に手元で:

```
my_images/
├── 0001.png
├── 0001.txt   # 画像と同名 .txt にタグ/キャプション
├── 0002.png
├── 0002.txt
└── ...
```

タグは Danbooru 風 (", " 区切り) を推奨。WD-EVA02-Tagger v3 などで
自動付与してから手で軽くクリーンするのが現実的。**この時点では
品質タグ・年タグ・メタタグを書いていても OK**(後で
`clean_captions.py` が全部抜く)。

**推奨枚数**: 3,000〜8,000 枚で十分。
このプロジェクトの Phase 1 は「**品質タグ依存性を消すだけ**」がゴールであり、
審美の方向性は変えない (= base モデルが本来出していた品質を tag なしで再現)。
そのため:
- 自分の "好み" でキュレーションする必要はない
- Danbooru `score≥150` など **品質フィルタだけ** かけてランダムサンプル
- artist タグも残す (`drop_artist_prob=0` デフォルト)
- 多様性 > 美的偏向(モデルの汎用性を保つため)