Spaces:

Astridkraft
/

Stable-ControlNet-GPU

Paused

App Files Files Community

Astridkraft commited on Dec 12, 2025

Commit

a445173

verified ·

1 Parent(s): 87dbb73

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -9

app.py CHANGED Viewed

@@ -319,6 +319,9 @@ pipe_txt2img = None
 current_pipe_model_id = None
 pipe_img2img = None
 def load_txt2img(model_id):
     """Lädt das Text-to-Image Modell basierend auf der Auswahl"""
     global pipe_txt2img, current_pipe_model_id
@@ -334,7 +337,7 @@ def load_txt2img(model_id):
     print(f"📝 Beschreibung: {config['description']}")
     try:
-        # VAE-Handling basierend auf Modellkonfiguration
         vae = None
         if config.get("requires_vae", False):
             print(f"🔧 Lade externe VAE: {config['vae_model']}")
@@ -356,7 +359,8 @@ def load_txt2img(model_id):
             "add_watermarker": False,
             "allow_pickle": True,
         }
         if model_id in SAFETENSORS_MODELS:
             model_params["use_safetensors"] = True
             print(f"ℹ️ Verwende safetensors für {model_id}")
@@ -378,7 +382,10 @@ def load_txt2img(model_id):
             model_id,
             **model_params
         ).to(device)
         print("⚙️ Konfiguriere Scheduler...")
         if pipe_txt2img.scheduler is None:
@@ -415,7 +422,8 @@ def load_txt2img(model_id):
         pipe_txt2img.enable_attention_slicing()
         print("✅ Attention Slicing aktiviert")
         if hasattr(pipe_txt2img, 'vae') and pipe_txt2img.vae is not None:
             try:
                 pipe_txt2img.enable_vae_slicing()
@@ -487,7 +495,9 @@ def load_img2img():
         print("✅ Inpainting-Modell geladen und optimiert")
     return pipe_img2img
 # === NEUE CALLBACK-FUNKTIONEN FÜR FORTSCHRITT ===
 class TextToImageProgressCallback:
     def __init__(self, progress, total_steps):
@@ -523,6 +533,7 @@ class ImageToImageProgressCallback:
         progress_percent = (step / self.actual_total_steps) * 100
         self.progress(progress_percent / 100, desc="Generierung läuft...")
         return callback_kwargs
 # === NEUE FUNKTIONEN FÜR DIE FEATURES (ANGEPASST FÜR 3 MODI) ===
 def create_preview_image(image, bbox_coords, mode):
@@ -568,7 +579,7 @@ def create_preview_image(image, bbox_coords, mode):
         box_color = (128, 128, 128, 200)
         text_bg_color = (64, 64, 64, 160)
-    # Skaliere Rahmendicke basierend auf Bildgröße
     border_width = max(8, image.width // 200)  # Mindestens 8px, bei großen Bildern dicker
     draw.rectangle([0, 0, preview.width-1, preview.height-1],
                   outline=border_color, width=border_width)
@@ -613,6 +624,7 @@ def update_live_preview(image, bbox_x1, bbox_y1, bbox_x2, bbox_y2, mode):
     bbox_coords = sort_coordinates(bbox_x1, bbox_y1, bbox_x2, bbox_y2)
     return create_preview_image(image, bbox_coords, mode)
 def process_image_upload(image):
     """Verarbeitet Bild-Upload und gibt Bild + Koordinaten zurück"""
@@ -634,6 +646,7 @@ def process_image_upload(image):
     print(f"Bild {width}x{height} -> Slider-Originalwerte: [{bbox_x1}, {bbox_y1}, {bbox_x2}, {bbox_y2}]")
     return preview, bbox_x1, bbox_y1, bbox_x2, bbox_y2
 # === FUNKTION FÜR SLIDER-UPDATE ===
 def update_slider_for_image(image):
@@ -718,6 +731,7 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
             print(f"ℹ️ Kein manueller Negativ-Prompt, verwende nur automatischen: {combined_negative_prompt}")
         print(f"✅ Finaler kombinierter Negativ-Prompt: {combined_negative_prompt}")
         # ===== GESICHTS-SPEZIFISCHE BOOSTER FÜR NUR-GESICHT MODUS =====
         if mode == "face_only_change":
@@ -732,6 +746,7 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
                 print(f"👤 Benutzer hat bereits Gesichts-Booster im Prompt")
         else:
             enhanced_prompt = prompt
         # ===== HINTERGRUND-BOOSTER FÜR UMGEBUNGS-ÄNDERUNG =====
         if mode == "environment_change":
@@ -744,7 +759,10 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         print(f"🎯 Finaler Prompt für {mode}: {enhanced_prompt}")
         progress(0, desc="Starte Generierung mit ControlNet...")
         # ===== MODUS-SPEZIFISCHE EINSTELLUNGEN =====
         adj_strength = min(0.85, strength * 1.25)
@@ -786,7 +804,11 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
                 original_mask,          # Originalmaske
                 target_size=IMG_SIZE
             )
             controlnet_input = scaled_image  # Verwende das skalierte Bild für ControlNet
             print(f"✅ Gemeinsame Skalierung abgeschlossen")
             print(f"   Original: {image.size} → Skaliert: {scaled_image.size}")
@@ -1230,13 +1252,13 @@ def main_ui():
                         )
                     with gr.Column():
                         img_steps = gr.Slider(
-                            minimum=10, maximum=100, value=35, step=1,
                             label="⚙️ Inferenz-Schritte",
                             info="Anzahl der Verarbeitungsschritte (25-45 für gute Ergebnisse)"
                         )
                     with gr.Column():
                         img_guidance = gr.Slider(
-                            minimum=1.0, maximum=20.0, value=7.5, step=0.5,
                             label="🎛️ Prompt-Stärke",
                             info="Einfluss des Prompts auf das Ergebnis (6-10 für natürliche Ergebnisse)"
                         )

 current_pipe_model_id = None
 pipe_img2img = None
+#Das Laden des Modells bedeutet, die trainierten Gewichte (Parameter) von der Festplatte zu lesen und
+#im Arbeitsspeicher (RAM) und idealerweise im Grafikspeicher (VRAM) zu halten, damit sie für Berechnungen schnell verfügbar sind.
 def load_txt2img(model_id):
     """Lädt das Text-to-Image Modell basierend auf der Auswahl"""
     global pipe_txt2img, current_pipe_model_id
     print(f"📝 Beschreibung: {config['description']}")
     try:
+        # VAE-Handling basierend auf Modellkonfiguration (Realistic Vision hat kein VAE-der Autoencoder ist ein CNN)
         vae = None
         if config.get("requires_vae", False):
             print(f"🔧 Lade externe VAE: {config['vae_model']}")
             "add_watermarker": False,
             "allow_pickle": True,
         }
+        # Jetzt wird nicht mehr erzwungen wo nach Gewichten gesucht werden soll sondern gezielt mitgeteilt welche Gewichte gewählt wurden.
         if model_id in SAFETENSORS_MODELS:
             model_params["use_safetensors"] = True
             print(f"ℹ️ Verwende safetensors für {model_id}")
             model_id,
             **model_params
         ).to(device)
+        # Der Scheduler (z.B. DPM-Solver++ oder PNDM) ist der Algorithmus, der den Zeitplan für das schrittweise Entrauschen (Denoising)
+        # festlegt - er bestimmt, wie viele und welche Rauschschritte in welcher Reihenfolge abgearbeitet werden.
         print("⚙️ Konfiguriere Scheduler...")
         if pipe_txt2img.scheduler is None:
         pipe_txt2img.enable_attention_slicing()
         print("✅ Attention Slicing aktiviert")
+        # Attention Slicing ist Aufteilung der Attention-Matrix auf die Heads -> späteres concat
         if hasattr(pipe_txt2img, 'vae') and pipe_txt2img.vae is not None:
             try:
                 pipe_txt2img.enable_vae_slicing()
         print("✅ Inpainting-Modell geladen und optimiert")
     return pipe_img2img
+#Die Callback-Funktion wird von der Pipeline nach jedem Verarbeitungsschritt aufgerufen und erhält Informationen
+#wie den aktuellen step und timestep. Diese nutzt der Progressbalken-Callback, um den Fortschritt zu berechnen und anzuzeigen.
 # === NEUE CALLBACK-FUNKTIONEN FÜR FORTSCHRITT ===
 class TextToImageProgressCallback:
     def __init__(self, progress, total_steps):
         progress_percent = (step / self.actual_total_steps) * 100
         self.progress(progress_percent / 100, desc="Generierung läuft...")
         return callback_kwargs
 # === NEUE FUNKTIONEN FÜR DIE FEATURES (ANGEPASST FÜR 3 MODI) ===
 def create_preview_image(image, bbox_coords, mode):
         box_color = (128, 128, 128, 200)
         text_bg_color = (64, 64, 64, 160)
+    # Skaliere Rahmendicke basierend auf Bildgröße (sonst bei großen Bildern ganz dünne Rahmen!)
     border_width = max(8, image.width // 200)  # Mindestens 8px, bei großen Bildern dicker
     draw.rectangle([0, 0, preview.width-1, preview.height-1],
                   outline=border_color, width=border_width)
     bbox_coords = sort_coordinates(bbox_x1, bbox_y1, bbox_x2, bbox_y2)
     return create_preview_image(image, bbox_coords, mode)
 def process_image_upload(image):
     """Verarbeitet Bild-Upload und gibt Bild + Koordinaten zurück"""
     print(f"Bild {width}x{height} -> Slider-Originalwerte: [{bbox_x1}, {bbox_y1}, {bbox_x2}, {bbox_y2}]")
     return preview, bbox_x1, bbox_y1, bbox_x2, bbox_y2
 # === FUNKTION FÜR SLIDER-UPDATE ===
 def update_slider_for_image(image):
             print(f"ℹ️ Kein manueller Negativ-Prompt, verwende nur automatischen: {combined_negative_prompt}")
         print(f"✅ Finaler kombinierter Negativ-Prompt: {combined_negative_prompt}")
         # ===== GESICHTS-SPEZIFISCHE BOOSTER FÜR NUR-GESICHT MODUS =====
         if mode == "face_only_change":
                 print(f"👤 Benutzer hat bereits Gesichts-Booster im Prompt")
         else:
             enhanced_prompt = prompt
         # ===== HINTERGRUND-BOOSTER FÜR UMGEBUNGS-ÄNDERUNG =====
         if mode == "environment_change":
         print(f"🎯 Finaler Prompt für {mode}: {enhanced_prompt}")
+        #Zur Überbrückung bis von der Pipelines Infos kommen!
         progress(0, desc="Starte Generierung mit ControlNet...")
         # ===== MODUS-SPEZIFISCHE EINSTELLUNGEN =====
         adj_strength = min(0.85, strength * 1.25)
                 original_mask,          # Originalmaske
                 target_size=IMG_SIZE
             )
+            #ControlNet ist ein paralleles Modell (CNN), das unveränderte Control-Maps (z. B. Tiefenkarten)
+            #verarbeitet und konditionierende Signale an das frozen UNet weiterleitet, um die Gesamtgeneration zu steuern,
+            #ohne pixelgenaue Manipulationen vorzunehmen. Es beeinflusst den Diffusionsprozess global/lokal durch Addition zu den Features.
+            #ControlNet-Bildgröße und Inpaint-Bildgröße müssen übereinstimmen!
             controlnet_input = scaled_image  # Verwende das skalierte Bild für ControlNet
             print(f"✅ Gemeinsame Skalierung abgeschlossen")
             print(f"   Original: {image.size} → Skaliert: {scaled_image.size}")
                         )
                     with gr.Column():
                         img_steps = gr.Slider(
+                            minimum=10, maximum=45, value=35, step=1,
                             label="⚙️ Inferenz-Schritte",
                             info="Anzahl der Verarbeitungsschritte (25-45 für gute Ergebnisse)"
                         )
                     with gr.Column():
                         img_guidance = gr.Slider(
+                            minimum=1.0, maximum=15.0, value=7.5, step=0.5,
                             label="🎛️ Prompt-Stärke",
                             info="Einfluss des Prompts auf das Ergebnis (6-10 für natürliche Ergebnisse)"
                         )