Spaces:

Astridkraft
/

Stable-ControlNet-GPU

Paused

App Files Files Community

Astridkraft commited on Dec 14, 2025

Commit

8644a82

verified ·

1 Parent(s): 8d979c1

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -0

app.py CHANGED Viewed

@@ -880,6 +880,49 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         controlnet_steps = min(25, int(steps * 0.8))
         print(f"⚙️ ControlNet Settings: Strength={controlnet_strength:.3f}, Steps={controlnet_steps}")
         progress(0.03, desc="ControlNet läuft...")
         # ===== WICHTIG: VARIABLEN FÜR KOMPLETTEN WORKFLOW =====

         controlnet_steps = min(25, int(steps * 0.8))
         print(f"⚙️ ControlNet Settings: Strength={controlnet_strength:.3f}, Steps={controlnet_steps}")
+        # ===== PUNKT 1: VAE-ENCODING & VERRAUSCHUNG =====
+        print("🔧 Punkt 1: Bereite verrauschtes Latent vor...")
+# 1. Bild für Latent-Encoding vorbereiten (bereits skaliertes Bild verwenden)
+if scaled_image is not None:
+    # img_for_latent ist das bereits herunterskalierte 512x512 Bild (mit Padding)
+    img_for_latent = scaled_image
+else:
+    # Fallback, falls keine Skalierung stattfand
+    img_for_latent = image.convert("RGB").resize((IMG_SIZE, IMG_SIZE), Image.Resampling.LANCZOS)
+# 2. In den Latent Space encoden (VAE)
+with torch.no_grad():
+    # Bild zu Tensor konvertieren
+    img_tensor = pipe.feature_extractor(img_for_latent, return_tensors="pt").pixel_values.to(device)
+    # Encoden
+    init_latent_dist = pipe.vae.encode(img_tensor).latent_dist
+    init_latents = init_latent_dist.sample()  # Latent mit zufälliger Variation aus der Verteilung
+    init_latents = init_latents * pipe.vae.config.scaling_factor  # Skalierung anpassen
+    print(f"✅ VAE-Encoding abgeschlossen. Latent Shape: {init_latents.shape}")
+# 3. Verrauschung basierend auf Strength (Scheduler)
+# Strength=0.8 bedeutet: Starte bei 80% des Rauschprozesses (stark verrauscht)
+strength = min(0.85, strength * 1.25)  # Ihre existierende Stärke-Anpassung
+latent_timestep = int(strength * pipe.scheduler.config.num_train_timesteps)
+# Rauschen generieren
+noise = torch.randn_like(init_latents)
+# Verrauschte Latents erzeugen
+noised_latents = pipe.scheduler.add_noise(init_latents, noise, torch.tensor([latent_timestep]))
+print(f"✅ Verrauschung abgeschlossen (Strength: {strength}, Timestep: {latent_timestep})")
+print(f"   Noised Latents Shape: {noised_latents.shape}")
+# Diese Variablen für später speichern:
+# - noised_latents: Das verrauschte Start-Latent für die Denoising-Schleife
+# - latent_timestep: Der Start-Timestep für die Denoising-Schleife
+# - init_latents: Das unverrauschte Latent (für spätere Referenz)
         progress(0.03, desc="ControlNet läuft...")
         # ===== WICHTIG: VARIABLEN FÜR KOMPLETTEN WORKFLOW =====