| # 事前準備 |
|
|
| [← README に戻る](../README.md) |
|
|
| ## 1. Modal セットアップ |
|
|
| ```bash |
| pip install modal |
| modal token new |
| ``` |
|
|
| ## 2. Hugging Face シークレット(必須) |
|
|
| `modal_app.py` は Modal 上の secret 名 `hf_token`(キー: `HF_TOKEN`)を参照する。 |
| 既に作成済みであれば追加作業は不要。新規の場合: |
|
|
| ```bash |
| modal secret create hf_token HF_TOKEN=hf_xxxxxxxxxxxxx |
| ``` |
|
|
| トークンは https://huggingface.co/settings/tokens で発行。Anima は public モデルなので |
| レート制限回避のために推奨。secret 名を変えたい場合は `modal_app.py` の |
| `from_name("hf_token", ...)` を書き換える。 |
|
|
| ### HF Hub への upload (LoRA 配布など) |
|
|
| `hf_token` は read 専用のことが多い。配布 / repo 作成には別途 write 権限のトークンを |
| `HF_TOKEN_WRITE` secret で持たせる: |
|
|
| ```bash |
| modal secret create HF_TOKEN_WRITE HF_TOKEN_WRITE=hf_xxxxxx_write_xxxxx |
| ``` |
|
|
| `modal_app.py` の `upload_lora_to_hf` がこの secret を参照する。 |
|
|
| ## 3. データセットの用意 |
|
|
| Modal に上げる前に手元で: |
|
|
| ``` |
| my_images/ |
| ├── 0001.png |
| ├── 0001.txt # 画像と同名 .txt にタグ/キャプション |
| ├── 0002.png |
| ├── 0002.txt |
| └── ... |
| ``` |
|
|
| タグは Danbooru 風 (", " 区切り) を推奨。WD-EVA02-Tagger v3 などで |
| 自動付与してから手で軽くクリーンするのが現実的。**この時点では |
| 品質タグ・年タグ・メタタグを書いていても OK**(後で |
| `clean_captions.py` が全部抜く)。 |
|
|
| **推奨枚数**: 3,000〜8,000 枚で十分。 |
| このプロジェクトの Phase 1 は「**品質タグ依存性を消すだけ**」がゴールであり、 |
| 審美の方向性は変えない (= base モデルが本来出していた品質を tag なしで再現)。 |
| そのため: |
| - 自分の "好み" でキュレーションする必要はない |
| - Danbooru `score≥150` など **品質フィルタだけ** かけてランダムサンプル |
| - artist タグも残す (`drop_artist_prob=0` デフォルト) |
| - 多様性 > 美的偏向(モデルの汎用性を保つため) |
|
|