jwheo
/

sr-diffusion

+project:
+  name: latent_pretrain_photo10k_b16
+  output_dir: /home/jwheojjang/scratch/sr-diffusion/runs/latent_pretrain_photo10k_b16
+logging:
+  wandb:
+    enabled: true
+    project: sr-diffusion
+    name: latent_pretrain_photo10k_b16
+    mode: online
+    dir: /home/jwheojjang/scratch/sr-diffusion/wandb
+    tags: [stage2, latent-pretrain, photo10k, b16]
+    watch: false
+  samples:
+    enabled: true
+    split: val
+    fallback_split: train
+    count: 4
+    indices: [0, 1, 2, 3]
+seed: 1337
+autoencoder:
+  config: configs/autoencoder_photo10k.yaml
+  checkpoint: /home/jwheojjang/scratch/sr-diffusion/runs/autoencoder_photo10k_b16_eval_online/checkpoints/best_eval_recon.pt
+data:
+  manifest: /home/jwheojjang/scratch/sr-diffusion/data/manifest_photo10k.csv
+  split: train
+  hr_size: 512
+  scale: 4
+  degradation_preset: mild
+  domains:
+    photo: 0
+    anime: 1
+  num_workers: 4
+model:
+  type: lr_to_latent_predictor
+  in_channels: 3
+  latent_channels: 16
+  base_channels: 128
+  num_blocks: 8
+  norm_groups: 32
+  num_domains: 2
+train:
+  device: auto
+  dtype: bf16
+  batch_size: 16
+  max_steps: 50000
+  lr: 0.0002
+  weight_decay: 0.0
+  grad_accum_steps: 1
+  log_every: 50
+  save_every: 1000
+  sample_every: 500
+eval:
+  enabled: true
+  split: val
+  limit: 100
+  batch_size: 16
+  num_workers: 4
+  every: 1000
+  run_at_start: true
+loss:
+  latent: charbonnier