| license: cc-by-nc-4.0 | |
| language: | |
| - en | |
| base_model: | |
| - stabilityai/stable-diffusion-3.5-medium | |
| # MANGA109 Pose HAの漫画画像で学習したText-Image-to-Image | |
| このリポジトリは、[MANGA109 Pose tools](https://github.com/kuri-lab/MANGA109-Pose-tools)の画像生成モデルです。画像生成モデルに入力する条件画像は、上記URLのレポジトリで作成してください。 | |
| ## 学習パラメータ | |
| |引数 | 値 | | |
| | ---- | ---- | | |
| |resolution | 512 | | |
| |train batch size | 4 | | |
| |learning rate | 1e-05 | | |
| |mixed precision | fp16 | | |
| |max train steps | 200,000 | | |
| ## 学習データセット | |
| MANGA109 Pose HA をtraining set,validation set,test set を8:1:1に分割したデータセット | |
| ## 作成者の環境 | |
| - GPU:H100NVL(1枚) | |
| - CUDA:12.4 | |
| - PyTorch:2.6.0+cu124 | |
| - diffusers:0.33.0.dev0 | |
| ## 計算時間 | |
| H100(NVL)94GB の1 つのGPU を用いて88 時間 | |
| 1 学習ステップあたり1.58 秒 | |
| ## License | |
| 本リポジトリは、 | |
| [Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) ](https://creativecommons.org/licenses/by-nc/4.0/deed.en)に基づいてライセンスされています。 | |
| ## 引用 | |
| このリポジトリを研究で使用する場合は,次の Bibtex エントリを使用して引用することを検討してください. | |
| ``` | |
| @article{okada2025manga109pose, | |
| title={MANGA109 に姿勢情報を追加したデータセットの構築による姿勢を制御した漫画キャラクター画像生成}, | |
| author={岡田 湧路 and 北川 峻 and 渡邉 謙吾 and 稲葉 通将 and 橋本 敦史 and 栗原 聡}, | |
| journal={人工知能学会全国大会論文集}, | |
| volume={JSAI2025}, | |
| pages={2O1GS1005-2O1GS1005} | |
| year={2025} | |
| } | |
| ``` | |
| ## 更新履歴 | |
| * 2025/04/25: [公開] | |
| * | |