recoilme commited on Nov 5, 2025

Commit

784604e

1 Parent(s): f2d7ce2

2511

Browse files

Files changed (17) hide show

media/result_grid.jpg +2 -2
media/result_grid.png +0 -3
samples/unet_320x640_0.jpg +2 -2
samples/unet_384x640_0.jpg +2 -2
samples/unet_448x640_0.jpg +2 -2
samples/unet_512x640_0.jpg +2 -2
samples/unet_576x640_0.jpg +2 -2
samples/unet_640x320_0.jpg +2 -2
samples/unet_640x384_0.jpg +2 -2
samples/unet_640x448_0.jpg +2 -2
samples/unet_640x512_0.jpg +2 -2
samples/unet_640x576_0.jpg +2 -2
samples/unet_640x640_0.jpg +2 -2
pipeline_sdxs-Copy1.py → src/pipeline_sdxs-Copy1.py +0 -0
test.ipynb +2 -2
train.py +7 -20
unet/diffusion_pytorch_model.safetensors +1 -1

media/result_grid.jpg CHANGED Viewed

Git LFS Details

SHA256: 9894a7d6b673827407d2a7142a84587d44a30b1019ffbf8ff6388f1cfe096354
Pointer size: 132 Bytes
Size of remote file: 5.64 MB

Git LFS Details

SHA256: 506996b6102645a13400234155a76eaf4da0b85ab1fef1ba7d5688ad3eec641c
Pointer size: 132 Bytes
Size of remote file: 5.59 MB

media/result_grid.png DELETED Viewed

Git LFS Details

SHA256: 1e53eb775a3c480da64980d9c3b497fabb81b476019077faf87e5b02a3ac1964
Pointer size: 132 Bytes
Size of remote file: 6.34 MB

samples/unet_320x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: c5e3fa89688a8a51ee3757140b1abaf419aa1cef975fc3943110cc4807da79cd
Pointer size: 130 Bytes
Size of remote file: 82.4 kB

Git LFS Details

SHA256: a9071970528d7d7a722121490d30df582f11581c1e181ae73a19db37f0fae4ab
Pointer size: 130 Bytes
Size of remote file: 78.9 kB

samples/unet_384x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 6061633df423e653726b6454f3fb9ca7850383de32e7f7c696f3432687ade0bf
Pointer size: 131 Bytes
Size of remote file: 131 kB

Git LFS Details

SHA256: 03021a050c5f16fa80953280a4f3a6e4ffb9e00784e21c1c1dd4d89a534aa0ea
Pointer size: 131 Bytes
Size of remote file: 116 kB

samples/unet_448x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: ba6f5ff4c3a5ca55e1da173794bda6009fae182240075b4d1c9f2c5b8eb1652b
Pointer size: 131 Bytes
Size of remote file: 206 kB

Git LFS Details

SHA256: dce6c3a842839781a5be918fd51888c86bc11d2b2076940bc8c8132497311d27
Pointer size: 131 Bytes
Size of remote file: 140 kB

samples/unet_512x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 99352f303d3c90db7bd6a8a30a16ccf5456e30a8d098f270d20078e1b3ed7651
Pointer size: 131 Bytes
Size of remote file: 138 kB

Git LFS Details

SHA256: cca4737a492b5bcc652b7b09c74e2434b6bc7468b42de1ec1f98f8c887ba9ef4
Pointer size: 131 Bytes
Size of remote file: 123 kB

samples/unet_576x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 9d096f0d9749fd90041dc276867bca046f06bd486df91aac4294dcbcbf7481d9
Pointer size: 131 Bytes
Size of remote file: 139 kB

Git LFS Details

SHA256: 6ff813d85ee22587a8747f6f84b5fb4e04871cbbf7014fb43e4cb3479044daa8
Pointer size: 130 Bytes
Size of remote file: 100 kB

samples/unet_640x320_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 0448ddd9d99766ab407deabc275ef8f175ca05a21d2959bcd0aa997f1fae6e50
Pointer size: 131 Bytes
Size of remote file: 108 kB

Git LFS Details

SHA256: 16595fea0b05667cd821d1e9677c5a65dcd2d890335aea104fa5ed267e1bc178
Pointer size: 131 Bytes
Size of remote file: 103 kB

samples/unet_640x384_0.jpg CHANGED Viewed

Git LFS Details

SHA256: dd62cb014dea9e8b5eee9de4e95dc64737b9515e07c51a3732b94913ef8d3df5
Pointer size: 130 Bytes
Size of remote file: 85.2 kB

Git LFS Details

SHA256: d4a819d67a4f68c081a4806b86c328170c75325ac3a8ecd963d1c6687d85b918
Pointer size: 130 Bytes
Size of remote file: 79.9 kB

samples/unet_640x448_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 6085c181633b969a00466fd71ef2dbaa7780e2888caedf5c10696b316d86cb37
Pointer size: 130 Bytes
Size of remote file: 86.8 kB

Git LFS Details

SHA256: b73f6fa5cffa3c816fb82a9e3519f5f44839272c81bf953ae7cb2d4884fadd72
Pointer size: 130 Bytes
Size of remote file: 63.6 kB

samples/unet_640x512_0.jpg CHANGED Viewed

Git LFS Details

SHA256: e44c577f0cbbd96171c2fc74b8a53c270c900a8cb949e085958271dac860d38e
Pointer size: 131 Bytes
Size of remote file: 105 kB

Git LFS Details

SHA256: ffdeebce70d94dc5e1f0466ce6dae03aae732e86612a2fb75cfd901b3c474d51
Pointer size: 130 Bytes
Size of remote file: 73.9 kB

samples/unet_640x576_0.jpg CHANGED Viewed

Git LFS Details

SHA256: 42f7b5828442194d36d3b16f1df653b322e16cd171e24441686957255f92ce3b
Pointer size: 131 Bytes
Size of remote file: 272 kB

Git LFS Details

SHA256: 582678e11cbaf6e936cba7e7b04ded03058968545b1dcd51cce33107e8295b2a
Pointer size: 131 Bytes
Size of remote file: 213 kB

samples/unet_640x640_0.jpg CHANGED Viewed

Git LFS Details

SHA256: ebd16b509dc204340399129b28df713fb1cb57e62c43e4fa348aa41bf869000c
Pointer size: 131 Bytes
Size of remote file: 268 kB

Git LFS Details

SHA256: 8597b55bf4e3357aab0e2bbeb5d2cbfcdfb5da1bdcd9eec786ce6bad38efbeb0
Pointer size: 131 Bytes
Size of remote file: 280 kB

pipeline_sdxs-Copy1.py → src/pipeline_sdxs-Copy1.py RENAMED Viewed

File without changes

test.ipynb CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7b9b5e44ec1e34e89b0a6024bf233b486c425325b537b42577bad7cc9da3c7a9
-size 5180264

 version https://git-lfs.github.com/spec/v1
+oid sha256:7754efea243246c21b73b743ea55055cff9ed385f22d119ee489931185366cf1
+size 8316949

train.py CHANGED Viewed

@@ -447,35 +447,22 @@ def get_negative_embedding(neg_prompt="", batch_size=1):
     # Загрузка моделей (если ещё не загружены)
     if not hasattr(get_negative_embedding, "tokenizer"):
         get_negative_embedding.tokenizer = AutoTokenizer.from_pretrained(
-            "Qwen/Qwen3-Embedding-0.6B", padding_side="left"
         )
         get_negative_embedding.text_model = AutoModel.from_pretrained(
-            "Qwen/Qwen3-Embedding-0.6B"
         ).to(device).eval()
-    # Вспомогательная функция для пулинга
-    def last_token_pool(last_hidden_states, attention_mask):
-        left_padding = (attention_mask[:, -1].sum() == attention_mask.shape[0])
-        if left_padding:
-            return last_hidden_states[:, -1]
-        else:
-            sequence_lengths = attention_mask.sum(dim=1) - 1
-            batch_size = last_hidden_states.shape[0]
-            return last_hidden_states[
-                torch.arange(batch_size, device=last_hidden_states.device),
-                sequence_lengths
-            ]
     # Вычисление эмбеддинга
-    def encode_texts(texts, max_length=512):
         with torch.inference_mode():
             toks = get_negative_embedding.tokenizer(
                 texts, return_tensors="pt", padding="max_length", truncation=True, max_length=max_length
             ).to(device)
-            outs = get_negative_embedding.text_model(**toks)
-            emb = last_token_pool(outs.last_hidden_state, toks["attention_mask"])
-            emb = emb.unsqueeze(1)  # Добавляем размерность sequence_length
-            return emb
     # Возвращаем эмбеддинг
     if not neg_prompt:

     # Загрузка моделей (если ещё не загружены)
     if not hasattr(get_negative_embedding, "tokenizer"):
         get_negative_embedding.tokenizer = AutoTokenizer.from_pretrained(
+            "Qwen/Qwen3-0.6B"
         )
         get_negative_embedding.text_model = AutoModel.from_pretrained(
+            "Qwen/Qwen3-0.6B"
         ).to(device).eval()
     # Вычисление эмбеддинга
+    def encode_texts(texts, max_length=150):
         with torch.inference_mode():
             toks = get_negative_embedding.tokenizer(
                 texts, return_tensors="pt", padding="max_length", truncation=True, max_length=max_length
             ).to(device)
+            outs = get_negative_embedding.text_model(**toks, output_hidden_states=True)
+            hidden_states = outs.hidden_states[-1]  # [B, L, D]
+            return hidden_states
     # Возвращаем эмбеддинг
     if not neg_prompt:

unet/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4fbf975ae1854d56d63011e6062054fe4abbd45ca011f66013bf0264f657d890
 size 6184944280

 version https://git-lfs.github.com/spec/v1
+oid sha256:c093c51d6be0a372c91657f1abdce28a61577134ef09eac531479ca384cef933
 size 6184944280