thegenerativegeneration
/

ukiyoe-diffusion-256

guideddiffusion

Model card Files Files and versions

ukiyoe-diffusion-256 / README.md

thegenerativegeneration's picture

thegenerativegeneration

Update README.md

44b8f97 over 3 years ago

|

history blame contribute delete

2.88 kB

	---
	tags:
	- discodiffusion
	- guideddiffusion
	thumbnail: https://de.gravatar.com/userimage/52045156/8ab369c1d246e65bda88813ce7c4cb81.jpeg
	datasets:
	- wikiart

	---


	# Ukiyo-e Diffusion

	If you make something using these models, you're welcome to mention me [@thegenerativegeneration](https://www.instagram.com/thegenerativegeneration/)


	Named by dataset used. Current and best version is [models/ukiyoe-all/v1/ema_0.9999_056000.pt](models/ukiyoe-all/v1/ema_0.9999_056000.pt)

	# Current Plans

	* clean dataset
	* remove borders
	* remove some of the samples with text in them

	# Models

	## Ukiyo-e-all

	### v1

	[models/ukiyoe-all/v1/ema_0.9999_056000.pt](models/ukiyoe-all/v1/ema_0.9999_056000.pt)

	Model configuration is:

	```python
	model_config = {
	'attention_resolutions': '32, 16, 8',
	'class_cond': False,
	'image_size': 256,
	'learn_sigma': True,
	'rescale_timesteps': True,
	'noise_schedule': 'linear',
	'num_channels': 128,
	'num_heads': 4,
	'num_res_blocks': 2,
	'resblock_updown': True,
	'use_checkpoint': True,
	'use_fp16': True,
	'use_scale_shift_norm': True,
	}
	```
	#### Tips

	- Results closest to original training data are achieved by turning off the secondary model in Disco Diffusion.
	- Turning secondary model on can lead to very creative results
	- It is not necessary to specify Ukiyo-e as artstyle to get ukiyo-e-like images.

	#### Examples

	If you make something nice using these models, I would like to link your image.

	##### Secondary Off

	![](models/ukiyoe-all/v1/images/secondary_off_3.png)
	![](models/ukiyoe-all/v1/images/secondary_off_0.png)
	![](models/ukiyoe-all/v1/images/secondary_off_1.png)
	![](models/ukiyoe-all/v1/images/secondary_off_2.png)

	##### Secondary On

	![](models/ukiyoe-all/v1/images/secondary_on_0.png)
	![](models/ukiyoe-all/v1/images/secondary_on_1.png)
	![](models/ukiyoe-all/v1/images/secondary_on_2.png)


	#### About
	Trained from scratch on a ~170000 images corpus of [ukiyo-e.org](https://ukiyo-e.org) filtered by [colorfulness](https://pyimagesearch.com/2017/06/05/computing-image-colorfulness-with-opencv-and-python/
	) >= 5.




	## (Deprecated) Ukiyo-e-few

	[models/ukiyoe-few/v1/ukiyoe_diffusion_256_022000.pt](models/ukiyoe-few/v1/ukiyoe_diffusion_256_022000.pt)

	Finetuned on 5224 images from Wikiart (1168) and ? ().


	Model configuration is

	```python
	model_config = {
	'attention_resolutions': '16',
	'class_cond': False,
	'diffusion_steps': 1000,
	'rescale_timesteps': True,
	'timestep_respacing': 'ddim100',
	'image_size': 256,
	'learn_sigma': True,
	'noise_schedule': 'linear',
	'num_channels': 128,
	'num_heads': 1,
	'num_res_blocks': 2,
	'use_checkpoint': True,
	'use_scale_shift_norm': False
	}
	```

	Trained using a fork of [guided-diffusion-sxela](https://github.com/thegenerativegeneration/guided-diffusion-sxela). Added random crop which did not lead to good results.