rapid-anima / docs /setup.md
darask0's picture
Initial commit: rapid-anima distillation codebase
77cc641 verified
|
Raw
History Blame Contribute Delete
2.12 kB
# 事前準備
[← README に戻る](../README.md)
## 1. Modal セットアップ
```bash
pip install modal
modal token new
```
## 2. Hugging Face シークレット(必須)
`modal_app.py` は Modal 上の secret 名 `hf_token`(キー: `HF_TOKEN`)を参照する。
既に作成済みであれば追加作業は不要。新規の場合:
```bash
modal secret create hf_token HF_TOKEN=hf_xxxxxxxxxxxxx
```
トークンは https://huggingface.co/settings/tokens で発行。Anima は public モデルなので
レート制限回避のために推奨。secret 名を変えたい場合は `modal_app.py`
`from_name("hf_token", ...)` を書き換える。
### HF Hub への upload (LoRA 配布など)
`hf_token` は read 専用のことが多い。配布 / repo 作成には別途 write 権限のトークンを
`HF_TOKEN_WRITE` secret で持たせる:
```bash
modal secret create HF_TOKEN_WRITE HF_TOKEN_WRITE=hf_xxxxxx_write_xxxxx
```
`modal_app.py``upload_lora_to_hf` がこの secret を参照する。
## 3. データセットの用意
Modal に上げる前に手元で:
```
my_images/
├── 0001.png
├── 0001.txt # 画像と同名 .txt にタグ/キャプション
├── 0002.png
├── 0002.txt
└── ...
```
タグは Danbooru 風 (", " 区切り) を推奨。WD-EVA02-Tagger v3 などで
自動付与してから手で軽くクリーンするのが現実的。**この時点では
品質タグ・年タグ・メタタグを書いていても OK**(後で
`clean_captions.py` が全部抜く)。
**推奨枚数**: 3,000〜8,000 枚で十分。
このプロジェクトの Phase 1 は「**品質タグ依存性を消すだけ**」がゴールであり、
審美の方向性は変えない (= base モデルが本来出していた品質を tag なしで再現)。
そのため:
- 自分の "好み" でキュレーションする必要はない
- Danbooru `score≥150` など **品質フィルタだけ** かけてランダムサンプル
- artist タグも残す (`drop_artist_prob=0` デフォルト)
- 多様性 > 美的偏向(モデルの汎用性を保つため)