DDPO Sharpness Checkpoints

LoRA checkpoints from DDPO fine-tuning of Stable Diffusion v1.4 with a sharpness reward (Laplacian variance).

Training Details

Uploaded every 10 epochs: checkpoint_0, checkpoint_10, ..., checkpoint_90, checkpoint_98 (final).

Downloads last month: -; Downloads are not tracked for this model. How to track

Video Preview