File size: 1,774 Bytes

85b5765

---
license: cc-by-nc-4.0
language:
- en
base_model:
- stabilityai/stable-diffusion-3.5-medium
---
# MANGA109 Pose HAの漫画画像で学習したText-Image-to-Image

このリポジトリは、[MANGA109 Pose tools](https://github.com/kuri-lab/MANGA109-Pose-tools)の画像生成モデルです。画像生成モデルに入力する条件画像は、上記URLのレポジトリで作成してください。


## 学習パラメータ
|引数 | 値 |
| ---- | ---- |
|resolution | 512 |
|train batch size | 4 |
|learning rate | 1e-05 |
|mixed precision | fp16 |
|max train steps | 200,000 |

## 学習データセット
MANGA109 Pose HA をtraining set，validation set，test set を8:1:1に分割したデータセット

## 作成者の環境
  - GPU：H100NVL（1枚）  
  - CUDA：12.4
  - PyTorch：2.6.0+cu124
  - diffusers:0.33.0.dev0

## 計算時間
H100(NVL)94GB の1 つのGPU を用いて88 時間
1 学習ステップあたり1.58 秒

## License
本リポジトリは、
[Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) ](https://creativecommons.org/licenses/by-nc/4.0/deed.en)に基づいてライセンスされています。

## 引用
このリポジトリを研究で使用する場合は，次の Bibtex エントリを使用して引用することを検討してください．

```
@article{okada2025manga109pose,
  title={MANGA109 に姿勢情報を追加したデータセットの構築による姿勢を制御した漫画キャラクター画像生成},
  author={岡田 湧路 and 北川 峻 and 渡邉 謙吾 and 稲葉 通将 and 橋本 敦史 and 栗原 聡},
  journal={人工知能学会全国大会論文集},
  volume={JSAI2025},
  pages={2O1GS1005-2O1GS1005}
  year={2025}
}
```

## 更新履歴
* 2025/04/25: [公開]
*