Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

samples/sample_0.jpg +2 -2
samples/sample_1.jpg +0 -0
samples/sample_2.jpg +0 -0
samples/sample_decoded.jpg +2 -2
test.ipynb +1 -1
train_vae.py +19 -11
vae/diffusion_pytorch_model.safetensors +1 -1

samples/sample_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 9494e60380a83272698eb19d7560d18f2f3a3a35ef37052a0bbb126676bdf234
Pointer size: 131 Bytes
Size of remote file: 128 kB

Git LFS Details

SHA256: 46a6075f2a3b751cc0d79d792f25fa56ff1c51b95ab11fdf75d51829d66d7133
Pointer size: 131 Bytes
Size of remote file: 128 kB

samples/sample_1.jpg CHANGED Viewed

samples/sample_2.jpg CHANGED Viewed

samples/sample_decoded.jpg CHANGED Viewed

Git LFS Details

SHA256: 9494e60380a83272698eb19d7560d18f2f3a3a35ef37052a0bbb126676bdf234
Pointer size: 131 Bytes
Size of remote file: 128 kB

Git LFS Details

SHA256: 46a6075f2a3b751cc0d79d792f25fa56ff1c51b95ab11fdf75d51829d66d7133
Pointer size: 131 Bytes
Size of remote file: 128 kB

test.ipynb CHANGED Viewed

@@ -2,7 +2,7 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 7,
    "id": "6ca10d55-03ed-4c8b-b32b-8d2f94d77162",
    "metadata": {},
    "outputs": [

  "cells": [
   {
    "cell_type": "code",
+   "execution_count": 1,
    "id": "6ca10d55-03ed-4c8b-b32b-8d2f94d77162",
    "metadata": {},
    "outputs": [

train_vae.py CHANGED Viewed

@@ -29,9 +29,9 @@ from collections import deque
 # --------------------------- Параметры ---------------------------
 ds_path            = "/workspace/d23"
 project            = "vae"
-batch_size         = 4
-base_learning_rate = 6e-6
-min_learning_rate  = 9e-7
 num_epochs         = 25
 sample_interval_share = 10
 use_wandb          = True
@@ -40,8 +40,8 @@ use_decay          = True
 optimizer_type     = "adam8bit"
 dtype              = torch.float32
-model_resolution   = 256
-high_resolution    = 512
 limit              = 0
 save_barrier       = 1.3
 warmup_percent     = 0.01
@@ -50,7 +50,7 @@ beta2              = 0.997
 eps                = 1e-8
 clip_grad_norm     = 1.0
 mixed_precision    = "no"
-gradient_accumulation_steps = 4
 generated_folder   = "samples"
 save_as            = "vae"
 num_workers        = 0
@@ -167,16 +167,24 @@ if full_training and not train_decoder_only:
         loss_ratios["kl"] = float(kl_ratio)
         trainable_module = core
 else:
-# учим только декодер + post_quant_conv на "ядре" модели
     if hasattr(core, "decoder"):
-        for name, p in core.decoder.named_parameters():
-            p.requires_grad = True
-            unfrozen_param_names.append(f"decoder.{name}")
     if hasattr(core, "post_quant_conv"):
         for name, p in core.post_quant_conv.named_parameters():
             p.requires_grad = True
             unfrozen_param_names.append(f"post_quant_conv.{name}")
-            trainable_module = core.decoder if hasattr(core, "decoder") else core
 print(f"[INFO] Разморожено параметров: {len(unfrozen_param_names)}. Первые 200 имён:")
 for nm in unfrozen_param_names[:200]:

 # --------------------------- Параметры ---------------------------
 ds_path            = "/workspace/d23"
 project            = "vae"
+batch_size         = 2
+base_learning_rate = 2e-6
+min_learning_rate  = 7e-7
 num_epochs         = 25
 sample_interval_share = 10
 use_wandb          = True
 optimizer_type     = "adam8bit"
 dtype              = torch.float32
+model_resolution   = 384
+high_resolution    = 768
 limit              = 0
 save_barrier       = 1.3
 warmup_percent     = 0.01
 eps                = 1e-8
 clip_grad_norm     = 1.0
 mixed_precision    = "no"
+gradient_accumulation_steps = 8
 generated_folder   = "samples"
 save_as            = "vae"
 num_workers        = 0
         loss_ratios["kl"] = float(kl_ratio)
         trainable_module = core
 else:
+    # учим только 0-й блок декодера + post_quant_conv
     if hasattr(core, "decoder"):
+        # --- только 0-й up_block ---
+        if hasattr(core.decoder, "up_blocks") and len(core.decoder.up_blocks) > 0:
+            for name, p in core.decoder.up_blocks[0].named_parameters():
+                p.requires_grad = True
+                unfrozen_param_names.append(f"decoder.up_blocks.0.{name}")
+        else:
+            print("[WARN] Decoder has no up_blocks — fallback to full decoder")
+            for name, p in core.decoder.named_parameters():
+                p.requires_grad = True
+                unfrozen_param_names.append(f"decoder.{name}")
     if hasattr(core, "post_quant_conv"):
         for name, p in core.post_quant_conv.named_parameters():
             p.requires_grad = True
             unfrozen_param_names.append(f"post_quant_conv.{name}")
+    trainable_module = core.decoder if hasattr(core, "decoder") else core
 print(f"[INFO] Разморожено параметров: {len(unfrozen_param_names)}. Первые 200 имён:")
 for nm in unfrozen_param_names[:200]:

vae/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71b36395ec5c24620ff6943eb10111bcb05e0af4c0ad35fde61020f148be115e
 size 444559412

 version https://git-lfs.github.com/spec/v1
+oid sha256:da1a8a728f24c5841cd0be986c90096d63800f8403bfba4b0e8c25c82c521bbf
 size 444559412