fev12345
/

Image_Generation_model_HA_Author

Model card Files Files and versions

Image_Generation_model_HA_Author / README.md

fev12345's picture

Upload folder using huggingface_hub

85b5765 verified 9 months ago

|

history blame contribute delete

1.77 kB

	---
	license: cc-by-nc-4.0
	language:
	- en
	base_model:
	- stabilityai/stable-diffusion-3.5-medium
	---
	# MANGA109 Pose HAの漫画画像で学習したText-Image-to-Image

	このリポジトリは、[MANGA109 Pose tools](https://github.com/kuri-lab/MANGA109-Pose-tools)の画像生成モデルです。画像生成モデルに入力する条件画像は、上記URLのレポジトリで作成してください。


	## 学習パラメータ
	\|引数 \| 値 \|
	\| ---- \| ---- \|
	\|resolution \| 512 \|
	\|train batch size \| 4 \|
	\|learning rate \| 1e-05 \|
	\|mixed precision \| fp16 \|
	\|max train steps \| 200,000 \|

	## 学習データセット
	MANGA109 Pose HA をtraining set，validation set，test set を8:1:1に分割したデータセット

	## 作成者の環境
	- GPU：H100NVL（1枚）
	- CUDA：12.4
	- PyTorch：2.6.0+cu124
	- diffusers:0.33.0.dev0

	## 計算時間
	H100(NVL)94GB の1 つのGPU を用いて88 時間
	1 学習ステップあたり1.58 秒

	## License
	本リポジトリは、
	[Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) ](https://creativecommons.org/licenses/by-nc/4.0/deed.en)に基づいてライセンスされています。

	## 引用
	このリポジトリを研究で使用する場合は，次の Bibtex エントリを使用して引用することを検討してください．

	```
	@article{okada2025manga109pose,
	title={MANGA109 に姿勢情報を追加したデータセットの構築による姿勢を制御した漫画キャラクター画像生成},
	author={岡田湧路 and 北川峻 and 渡邉謙吾 and 稲葉通将 and 橋本敦史 and 栗原聡},
	journal={人工知能学会全国大会論文集},
	volume={JSAI2025},
	pages={2O1GS1005-2O1GS1005}
	year={2025}
	}
	```

	## 更新履歴
	* 2025/04/25: [公開]
	*