recoilme commited on 23 days ago

Commit

0edaa52

1 Parent(s): 8f0128f

2512

Browse files

Files changed (31) hide show

samples/unet_384x768_0.jpg +2 -2
samples/unet_416x768_0.jpg +2 -2
samples/unet_448x768_0.jpg +2 -2
samples/unet_480x768_0.jpg +2 -2
samples/unet_512x768_0.jpg +2 -2
samples/unet_544x768_0.jpg +2 -2
samples/unet_576x768_0.jpg +2 -2
samples/unet_608x768_0.jpg +2 -2
samples/unet_640x768_0.jpg +2 -2
samples/unet_672x768_0.jpg +2 -2
samples/unet_704x768_0.jpg +2 -2
samples/unet_736x768_0.jpg +2 -2
samples/unet_768x384_0.jpg +2 -2
samples/unet_768x416_0.jpg +2 -2
samples/unet_768x448_0.jpg +2 -2
samples/unet_768x480_0.jpg +2 -2
samples/unet_768x512_0.jpg +2 -2
samples/unet_768x544_0.jpg +2 -2
samples/unet_768x576_0.jpg +2 -2
samples/unet_768x608_0.jpg +2 -2
samples/unet_768x640_0.jpg +2 -2
samples/unet_768x672_0.jpg +2 -2
samples/unet_768x704_0.jpg +2 -2
samples/unet_768x736_0.jpg +2 -2
samples/unet_768x768_0.jpg +2 -2
src/sdxs_create.ipynb +2 -2
src/sdxs_sdxxs_transfer.ipynb +2 -2
test.ipynb +2 -2
train.py +6 -6
unet/config.json +2 -2
unet/diffusion_pytorch_model.safetensors +2 -2

samples/unet_384x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 4ca711108a80892372bfcd4875835d95ba6ee0849d733cbf06732553de47e94d
Pointer size: 131 Bytes
Size of remote file: 205 kB

Git LFS Details

SHA256: 4b441c3236577ad766d186c346127408ecf1b28aaf2f6176a31505cc58a31619
Pointer size: 130 Bytes
Size of remote file: 74.7 kB

samples/unet_416x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 3fd17f0fabd3a1334ac48ee3a4931f034b1ed4a55db6dead20f57bf76da2845f
Pointer size: 130 Bytes
Size of remote file: 88.7 kB

Git LFS Details

SHA256: e97962e1c7cbd862b8c661ea80cef56bde24a447dd3e78e0284c422d317dea08
Pointer size: 130 Bytes
Size of remote file: 89 kB

samples/unet_448x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: c359d30cf06ee2c2e029f7cd30cb183339065f59091f4d8599d5614919f655ae
Pointer size: 130 Bytes
Size of remote file: 66.9 kB

Git LFS Details

SHA256: 6b38b7dc6ca78c582ea9c4d8b61059b291c0cc2382ec6b6311b705ef9778d10e
Pointer size: 131 Bytes
Size of remote file: 103 kB

samples/unet_480x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: bacaa68cfbdc8ac9699e9c4e56d529e756f23ceea9a64c65e7fc835fe5740838
Pointer size: 131 Bytes
Size of remote file: 156 kB

Git LFS Details

SHA256: d2c768a249c299c2aa2ab24bd75f0fb3541801aae7e833a1da90b63ed807f198
Pointer size: 131 Bytes
Size of remote file: 131 kB

samples/unet_512x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 6cf3cfd6c6044109dc3beb7b67f7b54fc3d4be1dea5b666a4c76e5ab1d3334e1
Pointer size: 131 Bytes
Size of remote file: 270 kB

Git LFS Details

SHA256: 2381c23a16882642e2148425acb27aabd9a1fc18088bc471cb3a196b7e4eb81c
Pointer size: 131 Bytes
Size of remote file: 130 kB

samples/unet_544x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 01e9464f2912c0ec4ced0fb3d00b4c114c475e60f8bc14312710043f77ea1030
Pointer size: 131 Bytes
Size of remote file: 113 kB

Git LFS Details

SHA256: a43b97427236277d8d8acac7d2415b560c5a0e2481829b32d188e1344a7049fe
Pointer size: 131 Bytes
Size of remote file: 172 kB

samples/unet_576x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 013e3f9cdb1a4497867ccb9f70b443fd4519e49ed2894aeeaa2c0e43e4d289af
Pointer size: 131 Bytes
Size of remote file: 135 kB

Git LFS Details

SHA256: f2b24f94b36a84d0654d82f4945832b80949bd5a18e83990ae36ea308d7d53c3
Pointer size: 131 Bytes
Size of remote file: 158 kB

samples/unet_608x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 59c950dde8209149c19c3fb93296cfba64446a8ee219c620c7303157ae51592b
Pointer size: 131 Bytes
Size of remote file: 225 kB

Git LFS Details

SHA256: 433922428c5410e30b1729046ce09494849bdded544a1e02fa370cf8b2f39567
Pointer size: 131 Bytes
Size of remote file: 123 kB

samples/unet_640x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: bdab687c1a70bf9cfd7bf3884dba98e553df3a17f7f32bd3308d58eee8f1fe3f
Pointer size: 131 Bytes
Size of remote file: 114 kB

Git LFS Details

SHA256: 9cf32611e7356f4269d83e4700a4fce9c25e0e1d9b911b520f4db3ba2eb81441
Pointer size: 131 Bytes
Size of remote file: 140 kB

samples/unet_672x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 59aeba2ecf617d737681d8ec2bad6ba2b911c84b78ca32d4a4ff29f49827f192
Pointer size: 131 Bytes
Size of remote file: 122 kB

Git LFS Details

SHA256: 1dee16153ed5796ca37cc89c844d9edde4e385dab5c243bd31d7e59737fafc41
Pointer size: 131 Bytes
Size of remote file: 141 kB

samples/unet_704x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 24133dd0cc40c0ab11bb6aa4d79f3e605c9168fd18c3c9980a9b31ff4ce3b743
Pointer size: 131 Bytes
Size of remote file: 195 kB

Git LFS Details

SHA256: 1afb940e66e7346e2c266d09d360fb500ab743d0ccbb3059277a1f1ed1536771
Pointer size: 131 Bytes
Size of remote file: 194 kB

samples/unet_736x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 332625ee3f7324c1cab960dbc3e09321cea8c630a20ad67d4da2fbb3c309ea91
Pointer size: 131 Bytes
Size of remote file: 126 kB

Git LFS Details

SHA256: 1242320ce600cfec3d35f6c545bea30ef8be2dce5dc48b550a0368ddeda8fa63
Pointer size: 131 Bytes
Size of remote file: 132 kB

samples/unet_768x384_0.jpg CHANGED Viewed

Git LFS Details

SHA256: d4323c64ee69a45b143006294e4bb77a924c307fc30d2a5009f60cd42ca39b76
Pointer size: 131 Bytes
Size of remote file: 176 kB

Git LFS Details

SHA256: 6fefe4b49022d0ee4adcb6cefc00dd831a84cd361242edfc1e454cddcb1fab62
Pointer size: 131 Bytes
Size of remote file: 195 kB

samples/unet_768x416_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 904e38b9d5e83bb0ada3859d2d703b3ee9237d3a970dfb0c132061ede4e66b5b
Pointer size: 131 Bytes
Size of remote file: 184 kB

Git LFS Details

SHA256: a5d902e6a2ac0c1cd761e2c5c328648128dda805cf58ba787265fc2e0a4909f0
Pointer size: 130 Bytes
Size of remote file: 25.5 kB

samples/unet_768x448_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 0168957d4a76739d358ef6c873586daf610b8c68cc381ae1e4669b5282dd9386
Pointer size: 131 Bytes
Size of remote file: 154 kB

Git LFS Details

SHA256: 845db8f88ba22f799ba16022a9473b8299eedbfb92e63275f8c5fe5630e3dfce
Pointer size: 130 Bytes
Size of remote file: 79.9 kB

samples/unet_768x480_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 2bd2c6696e8c963ec04c730c02a84c5951335b940b24a0047a23a7f51c5b7355
Pointer size: 131 Bytes
Size of remote file: 113 kB

Git LFS Details

SHA256: 4dbca5351c32d48457ebb64884d12ade2eab9db9211e2a7d67d22f27941622a1
Pointer size: 130 Bytes
Size of remote file: 37.8 kB

samples/unet_768x512_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 1bcb60ee2b86662bd26783fbf95a8a029e889ee6268c359cdfad8b023061666f
Pointer size: 131 Bytes
Size of remote file: 219 kB

Git LFS Details

SHA256: 95bbdf139f45f49b04331c41c1a14e5e43057b2b8429493f6b28e25e380250ec
Pointer size: 131 Bytes
Size of remote file: 194 kB

samples/unet_768x544_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 566d345d24e9f2d1920f6d95273f80e9e803c1b6db1b819845a899d3b3115196
Pointer size: 131 Bytes
Size of remote file: 107 kB

Git LFS Details

SHA256: 8b74afdc26239222060071a3cf5e91153f73c03bd578be81a0327d63a8edcf6a
Pointer size: 131 Bytes
Size of remote file: 222 kB

samples/unet_768x576_0.jpg CHANGED Viewed

Git LFS Details

SHA256: fae64c2d9738bd167f7183a736ab640bc8285e4bf137073a4686d1f8559ce786
Pointer size: 131 Bytes
Size of remote file: 207 kB

Git LFS Details

SHA256: 96193268aa7211f23f91373509378410a24fd779b55085965c15882fe5b87022
Pointer size: 131 Bytes
Size of remote file: 151 kB

samples/unet_768x608_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 840d9b71a642c7dd6f439336db44cdccb8644ee54dc55bee485dc00db2c6aa29
Pointer size: 131 Bytes
Size of remote file: 185 kB

Git LFS Details

SHA256: 330726b80bcc88040bdc7bdd4152d78573ddc86ba312c9da6adfde45ceffdefa
Pointer size: 131 Bytes
Size of remote file: 135 kB

samples/unet_768x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: ebdd1045e5b0e730510b5d41745e77562985480abd00960393b5e142e5f6ca7c
Pointer size: 131 Bytes
Size of remote file: 220 kB

Git LFS Details

SHA256: 736ce0ab3bab9fc5ec907ea02abb7d6776538d3b2603abe7b65af227e62644da
Pointer size: 131 Bytes
Size of remote file: 117 kB

samples/unet_768x672_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 74e924142663e598f1ea9aa3348e99ec17bbe5561e7a21568a42e72785b58ee1
Pointer size: 131 Bytes
Size of remote file: 212 kB

Git LFS Details

SHA256: 60e40dfcdb948dfb4991ea56217e7cf5e971dc035eb42a357e83e79272023677
Pointer size: 130 Bytes
Size of remote file: 87 kB

samples/unet_768x704_0.jpg CHANGED Viewed

Git LFS Details

SHA256: bf1775d77ed18cac206bb7297ccfaec2c73216c1c841ca1fd7af269ed0149f58
Pointer size: 131 Bytes
Size of remote file: 212 kB

Git LFS Details

SHA256: 85de5a7a42b5796fdf6742bf31e551e6b9b556809da50914624a6cf87438472a
Pointer size: 131 Bytes
Size of remote file: 114 kB

samples/unet_768x736_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 501e7d80f41cc0a16b5fcb35c9cdfc61a43c804692942d34271a0c2108b7a5fa
Pointer size: 131 Bytes
Size of remote file: 104 kB

Git LFS Details

SHA256: ee69e25db7c3050092a410d511eb0dba44e43e4082359e698f1a7bfc06200e60
Pointer size: 130 Bytes
Size of remote file: 77.2 kB

samples/unet_768x768_0.jpg CHANGED Viewed

Git LFS Details

SHA256: b43905be77dd21ca75f97ad69fcd8aace9a1b2049ac6f1c0e363731d840d770f
Pointer size: 131 Bytes
Size of remote file: 154 kB

Git LFS Details

SHA256: bfc4466b5ebd95634faf52c59cabbb9e6df67d654a15f3ee22f07e3117fe0ed4
Pointer size: 131 Bytes
Size of remote file: 296 kB

src/sdxs_create.ipynb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e204cfa450a5fed8f3651be4a44f5ba8c86108bf4e51c9c61f6bee8d6a4be98f
-size 8034

 version https://git-lfs.github.com/spec/v1
+oid sha256:8c2659b9cf3ffaea51ac60f748764234bb55403da46efc1e77ab6259ebd2bc44
+size 8033

src/sdxs_sdxxs_transfer.ipynb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b99638d02771a8537a64eee78ab9c671238eb575e3324e02861b5cfbb13b96f8
-size 168191

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb62c419aa9b0daaf7da17486c3e2e55f7bdada8c9baa0092549114c8f7e45fd
+size 27104

test.ipynb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c4b88374c0972c157e27fdd015b1fb1303a05d9634a8a90a8bd2cbb7d6f513a
-size 10053602

 version https://git-lfs.github.com/spec/v1
+oid sha256:487dd5242008c70fe41643c48bbfbf595908048b2faed4254cf3bbc613858299
+size 10046639

train.py CHANGED Viewed

@@ -29,11 +29,11 @@ from transformers import AutoTokenizer, AutoModel
 # --------------------------- Параметры ---------------------------
 ds_path = "/workspace/sdxs/datasets/768"
 project = "unet"
-batch_size = 60
-base_learning_rate = 2.7e-5
 min_learning_rate = 2.7e-5
 num_epochs = 100
-sample_interval_share = 5
 max_length = 192
 use_wandb = True
 use_comet_ml = False
@@ -173,12 +173,12 @@ def encode_texts(texts, max_length=max_length):
         #return hidden, attention_mask
         # --- НОВАЯ ЛОГИКА: ОБЪЕДИНЕНИЕ ДЛЯ КРОСС-ВНИМАНИЯ ---
-        # 1. Расширяем пулинг-вектор до последовательности [B, 1, 1024]
         pooled_expanded = pooled.unsqueeze(1)
         # 2. Объединяем последовательность токенов и пулинг-вектор
         # !!! ИЗМЕНЕНИЕ ЗДЕСЬ !!!: Пулинг идет ПЕРВЫМ
-        # Теперь: [B, 1 + L, 1024]. Пулинг стал токеном в НАЧАЛЕ.
         new_encoder_hidden_states = torch.cat([pooled_expanded, hidden], dim=1)
         # 3. Обновляем маску внимания для нового токена
@@ -476,7 +476,7 @@ fixed_samples = get_fixed_samples_by_resolution(dataset)
 # --- [UPDATED] Функция для негативного эмбеддинга (возвращает 3 элемента) ---
 def get_negative_embedding(neg_prompt="", batch_size=1):
     if not neg_prompt:
-        hidden_dim = 1024
         seq_len = max_length
         empty_emb = torch.zeros((batch_size, seq_len, hidden_dim), dtype=dtype, device=device)
         empty_mask = torch.ones((batch_size, seq_len), dtype=torch.int64, device=device)

 # --------------------------- Параметры ---------------------------
 ds_path = "/workspace/sdxs/datasets/768"
 project = "unet"
+batch_size = 40
+base_learning_rate = 4e-5
 min_learning_rate = 2.7e-5
 num_epochs = 100
+sample_interval_share = 6
 max_length = 192
 use_wandb = True
 use_comet_ml = False
         #return hidden, attention_mask
         # --- НОВАЯ ЛОГИКА: ОБЪЕДИНЕНИЕ ДЛЯ КРОСС-ВНИМАНИЯ ---
+        # 1. Расширяем пулинг-вектор до последовательности [B, 1, emb]
         pooled_expanded = pooled.unsqueeze(1)
         # 2. Объединяем последовательность токенов и пулинг-вектор
         # !!! ИЗМЕНЕНИЕ ЗДЕСЬ !!!: Пулинг идет ПЕРВЫМ
+        # Теперь: [B, 1 + L, emb]. Пулинг стал токеном в НАЧАЛЕ.
         new_encoder_hidden_states = torch.cat([pooled_expanded, hidden], dim=1)
         # 3. Обновляем маску внимания для нового токена
 # --- [UPDATED] Функция для негативного эмбеддинга (возвращает 3 элемента) ---
 def get_negative_embedding(neg_prompt="", batch_size=1):
     if not neg_prompt:
+        hidden_dim = 2048
         seq_len = max_length
         empty_emb = torch.zeros((batch_size, seq_len, hidden_dim), dtype=dtype, device=device)
         empty_mask = torch.ones((batch_size, seq_len), dtype=torch.int64, device=device)

unet/config.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:987ce2ea59106bf0806b16c21fff90d6fe6e7a90101e0157d8295803dbf34f2b
-size 1892

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb10c12478625b355068dbfce29e8db3c8a52d03e10508452e4feb5404545584
+size 1876

unet/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05a101235ddd6d0bd77fc5fd5ffd4ee1091d6e3be77b543ddab7687da35bf5cf
-size 3302474272

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a548c55ca1e248fcbdd0b198192d0213bf0e20a8d66b63b01b722964e61af80
+size 7444321360