| # frog train benchmark | |
| ハローカエル(スペルミスに気を付けよう) | |
| ## 概要 | |
| - kohya train_networkのベンチです | |
| - サンプルのカエルを使います | |
| - https://note.com/kohya_ss/n/nb20c5187e15a | |
| - https://note.com/api/v2/attachments/download/e3cd9aa39e600cac51e2022eaa01a931 | |
| - 中身をこのリポジトリにコピーしてあります | |
| - モデルはSDv1.5を使います | |
| - https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned.safetensors | |
| - pruneしたファイルを用意してあります | |
| ## 実行 | |
| - Windows | |
| - バッチをダウンロードして任意のディレクトリ(日本語やスペースが無いと良い)に置いて実行します | |
| - https://huggingface.co/aka7774/frog_bench/resolve/main/frog_bench.bat | |
| - sd-scriptsやvenvのインストールが行われます | |
| - SDv1.5モデルのダウンロードが行われます | |
| - 学習が行われます | |
| - 推論が行われます sd-scripts/txt2img/ に画像を保存します | |
| - 学習(accelerateコマンド)の所要時間が表示されます | |
| - sd-scripts/result.txt にも保存されます | |
| - Windows以外もしくは環境構築済みの場合 | |
| - サンプル通りに学習を実行してaccelerateコマンドにかかったtimeを計測してください | |
| - bitsandbytesでエラーが出る場合 | |
| - --use-8bit-adamを外すといいかも | |
| - VRAMの使用量がギリギリの場合 | |
| - batch_sizeを下げたほうが速く終わることもあるかも | |
| ## 設定 | |
| バッチファイルを編集することでいくつかの設定が出来ます。 | |
| - bypass Install CUDA Toolkit | |
| - pytorchのlibにPATHを通すことでCUDA Toolkitのインストールを省略する | |
| - Path to | |
| - PythonとgitにPATHが通っていない時にフルパスで指定する | |
| - Pythonとgit自体のインストールは別途必要 | |
| - VERS | |
| - 1はkohya推奨バージョン(古い) | |
| - 2は1111推奨バージョン(新しい) xformersが動かない可能性がある | |
| - MODE | |
| - 複数回実行したい時にインストールや学習を飛ばす | |
| - BATCH_SIZE | |
| - VRAMが10GB未満の時に減らす | |
| # 変更点 | |
| - num_cpu_threads_per_process(未変更) | |
| - 1のほうがいいらしいけどサンプルが4なのでそのまま | |
| - learning_rate(未変更) | |
| - 途中で仕様変更があったので1桁減らしたほうがいいらしいけどそのまま | |
| - inference(gen_img_diffusers.py) | |
| - 公式のオプションがbf16だったけどA100でしか動かないというエラーが出るのでfp16に変えてあります | |
| - interactiveしなくて済むようにした | |
| - accelerate config | |
| - accelerate launchに引数を追加することで割愛しています | |