Spaces:

Astridkraft
/

Stable-ControlNet-GPU

Paused

App Files Files Community

Astridkraft commited on Dec 9, 2025

Commit

33d55e6

verified ·

1 Parent(s): e3dadd3

Update app.py

Browse files

Files changed (1) hide show

app.py +198 -62

app.py CHANGED Viewed

@@ -104,24 +104,44 @@ def auto_negative_prompt(positive_prompt):
     else:
         return base_negatives
-# === GESICHTSMASKEN-FUNKTIONEN ===
-def create_face_mask(image, bbox_coords, face_preserve):
-    """Erzeugt eine Gesichtsmaske - WEIßE Bereiche werden VERÄNDERT, SCHWARZE BLEIBEN"""
     mask = Image.new("L", image.size, 0)  # Start mit komplett schwarzer Maske (alles geschützt)
     if bbox_coords and all(coord is not None for coord in bbox_coords):
         x1, y1, x2, y2 = bbox_coords
         draw = ImageDraw.Draw(mask)
-        if face_preserve:
-            # GESICHTSERHALTUNG: Maske um das Gesicht herum zeichnen
             draw.rectangle([0, 0, image.size[0], image.size[1]], fill=255)  # Alles weiß = verändern
             draw.rectangle([x1, y1, x2, y2], fill=0)  # Gesicht schwarz = geschützt (rechteckig)
-            print("Gesicht wird GESCHÜTZT - Umgebung wird verändert (rechteckige Maske)")
-        else:
-            # NUR GESICHT VERÄNDERN: Nur das Gesicht wird weiß (verändert)
-            draw.rectangle([x1, y1, x2, y2], fill=255)  # Gesicht weiß = verändern (rechteckig)
-            print("Nur Gesicht wird verändert - Umgebung bleibt erhalten (rechteckige Maske)")
     return mask
@@ -361,22 +381,51 @@ class ImageToImageProgressCallback:
         self.progress(progress_percent / 100, desc="Generierung läuft...")
         return callback_kwargs
-# === NEUE FUNKTIONEN FÜR DIE FEATURES ===
-def create_preview_image(image, bbox_coords, face_preserve, mode_color):
-    """Erstellt eine Vorschau mit farbigem Rahmen basierend auf dem Modus"""
     if image is None:
         return None
     preview = image.copy()
     draw = ImageDraw.Draw(preview)
-    if mode_color == "red":
-        border_color = (255, 0, 0, 180)
-        mode_text = "NUR BILDELEMENT VERÄNDERN"
     else:
-        border_color = (0, 255, 0, 180)
-        mode_text = "BILDELEMENT BEIBEHALTEN"
     border_width = 8
     draw.rectangle([0, 0, preview.width-1, preview.height-1],
                   outline=border_color, width=border_width)
@@ -384,29 +433,33 @@ def create_preview_image(image, bbox_coords, face_preserve, mode_color):
     if bbox_coords and all(coord is not None for coord in bbox_coords):
         x1, y1, x2, y2 = bbox_coords
-        box_color = (255, 255, 0, 200)
         draw.rectangle([x1, y1, x2, y2], outline=box_color, width=3)
         text_color = (255, 255, 255)
-        bg_color = (0, 0, 0, 160)
         text_bbox = draw.textbbox((x1, y1 - 25), mode_text)
         draw.rectangle([text_bbox[0]-5, text_bbox[1]-2, text_bbox[2]+5, text_bbox[3]+2],
-                      fill=bg_color)
         draw.text((x1, y1 - 25), mode_text, fill=text_color)
     return preview
-def update_live_preview(image, bbox_x1, bbox_y1, bbox_x2, bbox_y2, face_preserve):
-    """Aktualisiert die Live-Vorschau bei Koordinaten-Änderungen"""
     if image is None:
         return None
     bbox_coords = [bbox_x1, bbox_y1, bbox_x2, bbox_y2]
-    mode_color = "green" if face_preserve else "red"
-    return create_preview_image(image, bbox_coords, face_preserve, mode_color)
 def process_image_upload(image):
     """Verarbeitet Bild-Upload und gibt Bild + Koordinaten zurück"""
@@ -420,11 +473,12 @@ def process_image_upload(image):
     bbox = auto_detect_face_area(image)
     bbox_x1, bbox_y1, bbox_x2, bbox_y2 = bbox
-    preview = create_preview_image(image, bbox, True, "green")
     return preview, bbox_x1, bbox_y1, bbox_x2, bbox_y2
-# === HAUPTFUNKTIONEN ===
 def text_to_image(prompt, model_id, steps, guidance_scale, progress=gr.Progress()):
     try:
         if not prompt or not prompt.strip():
@@ -518,8 +572,20 @@ def text_to_image(prompt, model_id, steps, guidance_scale, progress=gr.Progress(
         return None, error_msg
 def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
-                 face_preserve, bbox_x1, bbox_y1, bbox_x2, bbox_y2,
                  progress=gr.Progress()):
     try:
         if image is None:
             return None
@@ -527,17 +593,17 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         import time, random
         start_time = time.time()
-        print(f"Img2Img Start → Strength: {strength}, Steps: {steps}, Guidance: {guidance_scale}")
-        print(f"Prompt: {prompt}")
-        print(f"Negativ-Prompt: {neg_prompt}")
-        print(f"Gesicht beibehalten: {face_preserve}")
-                 # ===== NEU: AUTOMATISCHEN NEGATIV-PROMPT GENERIEREN =====
         auto_negatives = auto_negative_prompt(prompt)
         print(f"🤖 Automatisch generierter Negativ-Prompt: {auto_negatives}")
-        # ===== NEU: KOMBINIERE MANUELLEN UND AUTOMATISCHEN PROMPT =====
         combined_negative_prompt = ""
         if neg_prompt and neg_prompt.strip():
@@ -546,7 +612,6 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
             print(f"👤 Benutzer Negativ-Prompt: {user_neg}")
             # Entferne Duplikate zwischen automatischen und manuellen Prompts
-            # Konvertiere beide in Sets für einfachen Duplikatvergleich
             user_words = [word.strip().lower() for word in user_neg.split(",")]
             auto_words = [word.strip().lower() for word in auto_negatives.split(",")]
@@ -558,7 +623,7 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
                 if auto_word and auto_word not in user_words:
                     combined_words.append(auto_word)
-            # Zusammenfügen und Duplikate entfernen (für den Fall von Duplikaten innerhalb des gleichen Prompts)
             unique_words = []
             seen_words = set()
             for word in combined_words:
@@ -573,26 +638,34 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
             print(f"ℹ️ Kein manueller Negativ-Prompt, verwende nur automatischen: {combined_negative_prompt}")
         print(f"✅ Finaler kombinierter Negativ-Prompt: {combined_negative_prompt}")
-        # ===== ENDE DER NEUEN LOGIK =====
         progress(0, desc="Starte Generierung mit ControlNet...")
         adj_strength = min(0.85, strength * 1.25)
-        if face_preserve:
-            controlnet_strength = adj_strength * 0.8
-            print(f"🎯 ControlNet Modus: Umgebung beibehalten (Strength = {controlnet_strength:.3f})")
-        else:
             controlnet_strength = adj_strength * 0.5
-            print(f"🎯 ControlNet Modus: Person beibehalten (Strength = {controlnet_strength:.3f})")
         controlnet_steps = min(25, int(steps * 0.8))
-        print(f"🎯 Steps={steps}, ControlNet-Steps={controlnet_steps}, Strength={controlnet_strength:.3f}")
         progress(0.05, desc="Erstelle ControlNet Maps...")
         controlnet_output, inpaint_input = controlnet_processor.generate_with_controlnet(
             image=image,
             prompt=prompt,
@@ -601,7 +674,7 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
             guidance_scale=guidance_scale,
             controlnet_strength=controlnet_strength,
             progress=progress,
-            keep_environment=face_preserve
         )
         print(f"✅ ControlNet Output erhalten: {type(controlnet_output)}")
@@ -616,8 +689,9 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         adj_guidance = min(guidance_scale, 12.0)
         seed = random.randint(0, 2**32 - 1)
         generator = torch.Generator(device=device).manual_seed(seed)
-        print(f"Using seed: {seed}")
         mask = None
         if bbox_x1 and bbox_y1 and bbox_x2 and bbox_y2:
             orig_w, orig_h = image.size
@@ -628,10 +702,12 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
                 int(bbox_x2 * scale_x),
                 int(bbox_y2 * scale_y)
             ]
-            print(f"Skalierte Koordinaten: {bbox_coords}")
-            mask = create_face_mask(img_resized, bbox_coords, face_preserve)
             if mask:
-                print("✅ Maske erfolgreich erstellt")
         else:
             print("⚠️ Keine gültigen Koordinaten – keine Maske")
@@ -641,6 +717,7 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         callback = ImageToImageProgressCallback(progress, int(steps), adj_strength)
         result = pipe(
             prompt=prompt,
             negative_prompt=combined_negative_prompt,
@@ -655,7 +732,10 @@ def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
         )
         end_time = time.time()
-        print(f"🕒 Dauer: {end_time - start_time:.2f} Sekunden")
         generated_image = result.images[0]
         return generated_image
@@ -685,6 +765,10 @@ def update_model_settings(model_id):
     )
 def main_ui():
     with gr.Blocks(
         title="AI Image Generator",
         theme=gr.themes.Base(),
@@ -778,6 +862,31 @@ def main_ui():
             color: #721c24;
             border: 1px solid #f5c6cb;
         }
         """
     ) as demo:
@@ -872,7 +981,7 @@ def main_ui():
                 )
             with gr.Tab("Bild zu Bild"):
-                gr.Markdown("## 🖼️ Bild zu Bild Transformation")
                 with gr.Row():
                     with gr.Column():
@@ -891,12 +1000,33 @@ def main_ui():
                             show_download_button=False
                         )
                 with gr.Row():
-                    face_preserve = gr.Checkbox(
-                        label="🛡️ Schutzmodus",
-                        value=True,
-                        info="🟢 AN: Alles AUSSERHALB des gelben Rahmens verändern | 🔴 AUS: Nur INNERHALB des gelben Rahmens verändern"
-                    )
                 with gr.Row():
                     gr.Markdown("### 📐 Bildelementbereich anpassen")
@@ -967,10 +1097,12 @@ def main_ui():
                 with gr.Row():
                    gr.Markdown(
                      "### 📋 Hinweise:\n"
                      "• **🆕 Automatische Bildelementerkennung** setzt Koordinaten beim Upload\n"
-                     "• **🆕 Live-Vorschau** zeigt farbige Rahmen je nach Modus (🔴 Rot / 🟢 Grün)\n"
                      "• **🆕 Koordinaten-Schieberegler** für präzise Anpassung mit Live-Update\n"
-                     "• **Koordinaten nur bei erkennbaren Verzerrungen anpassen** (Bereiche leicht verschieben)"
                     )
                 transform_btn = gr.Button("🔄 Bild transformieren", variant="primary")
@@ -989,8 +1121,10 @@ def main_ui():
                     outputs=[preview_output, bbox_x1, bbox_y1, bbox_x2, bbox_y2]
                 )
-                coordinate_inputs = [img_input, bbox_x1, bbox_y1, bbox_x2, bbox_y2, face_preserve]
                 for slider in [bbox_x1, bbox_y1, bbox_x2, bbox_y2]:
                     slider.change(
                         fn=update_live_preview,
@@ -998,18 +1132,20 @@ def main_ui():
                         outputs=preview_output
                     )
-                face_preserve.change(
                     fn=update_live_preview,
                     inputs=coordinate_inputs,
                     outputs=preview_output
                 )
                 transform_btn.click(
                     fn=img_to_image,
                     inputs=[
                         img_input, img_prompt, img_neg_prompt,
                         strength_slider, img_steps, img_guidance,
-                        face_preserve, bbox_x1, bbox_y1, bbox_x2, bbox_y2
                     ],
                     outputs=img_output,
                     concurrency_limit=1
@@ -1027,4 +1163,4 @@ if __name__ == "__main__":
         show_error=True,
         share=False,
         ssr_mode=False  # SSR deaktivieren für Stabilität
-    )

     else:
         return base_negatives
+# === GESICHTSMASKEN-FUNKTIONEN (ERWEITERT FÜR 3 MODI) ===
+def create_face_mask(image, bbox_coords, mode):
+    """
+    ERWEITERTE FUNKTION: Erzeugt Maske basierend auf 3 Modi
+    Weiße Bereiche werden VERÄNDERT, Schwarze bleiben ERHALTEN
+    Parameter:
+    - image: PIL Image
+    - bbox_coords: [x1, y1, x2, y2]
+    - mode: "environment_change", "focus_change", "face_only_change"
+    Returns:
+    - PIL Image (L-Modus, 0=schwarz=erhalten, 255=weiß=verändern)
+    """
     mask = Image.new("L", image.size, 0)  # Start mit komplett schwarzer Maske (alles geschützt)
     if bbox_coords and all(coord is not None for coord in bbox_coords):
         x1, y1, x2, y2 = bbox_coords
         draw = ImageDraw.Draw(mask)
+        if mode == "environment_change":
+            # MODUS 1: Umgebung ändern (Depth + Canny)
+            # Maske: Alles weiß AUSSER Gesicht (schwarz)
             draw.rectangle([0, 0, image.size[0], image.size[1]], fill=255)  # Alles weiß = verändern
             draw.rectangle([x1, y1, x2, y2], fill=0)  # Gesicht schwarz = geschützt (rechteckig)
+            print("🎯 MODUS: Umgebung ändern - Alles außer Gesicht wird verändert")
+        elif mode == "focus_change":
+            # MODUS 2: Focus verändern (OpenPose + Canny)
+            # Maske: Nur innerhalb der Box weiß (Rest schwarz)
+            draw.rectangle([x1, y1, x2, y2], fill=255)  # Nur Box weiß = verändern
+            print("🎯 MODUS: Focus verändern - Nur innerhalb der Box wird verändert")
+        elif mode == "face_only_change":
+            # MODUS 3: Ausschließlich Gesicht (Depth + Canny)
+            # Maske: Nur innerhalb der Box weiß (Rest schwarz) - wie focus_change
+            draw.rectangle([x1, y1, x2, y2], fill=255)  # Nur Box weiß = verändern
+            print("🎯 MODUS: Ausschließlich Gesicht - Nur Gesicht wird verändert")
     return mask
         self.progress(progress_percent / 100, desc="Generierung läuft...")
         return callback_kwargs
+# === NEUE FUNKTIONEN FÜR DIE FEATURES (ANGEPASST FÜR 3 MODI) ===
+def create_preview_image(image, bbox_coords, mode):
+    """
+    NEUE FUNKTION: Erstellt Vorschau basierend auf 3 Modi mit farbigen Rahmen
+    Parameter:
+    - image: PIL Image
+    - bbox_coords: [x1, y1, x2, y2]
+    - mode: "environment_change", "focus_change", "face_only_change"
+    Returns:
+    - PIL Image mit farbigem Rahmen und Text
+    """
     if image is None:
         return None
     preview = image.copy()
     draw = ImageDraw.Draw(preview)
+    # Farben basierend auf Modus
+    if mode == "environment_change":
+        border_color = (0, 255, 0, 180)  # Grün für Umgebung
+        mode_text = "UMGEBUNG ÄNDERN (Gesicht geschützt)"
+        box_color = (255, 255, 0, 200)  # Gelb für geschütztes Gesicht
+        text_bg_color = (0, 128, 0, 160)  # Dunkelgrün
+    elif mode == "focus_change":
+        border_color = (255, 165, 0, 180)  # Orange für Focus
+        mode_text = "FOCUS VERÄNDERN (Gesicht+Körper)"
+        box_color = (255, 0, 0, 200)  # Rot für Veränderungsbereich
+        text_bg_color = (255, 140, 0, 160)  # Dunkelorange
+    elif mode == "face_only_change":
+        border_color = (255, 0, 0, 180)  # Rot für nur Gesicht
+        mode_text = "NUR GESICHT VERÄNDERN"
+        box_color = (255, 0, 0, 200)  # Rot für Veränderungsbereich
+        text_bg_color = (128, 0, 0, 160)  # Dunkelrot
     else:
+        # Fallback
+        border_color = (128, 128, 128, 180)
+        mode_text = "UNBEKANNTER MODUS"
+        box_color = (128, 128, 128, 200)
+        text_bg_color = (64, 64, 64, 160)
+    # Rahmen um das gesamte Bild
     border_width = 8
     draw.rectangle([0, 0, preview.width-1, preview.height-1],
                   outline=border_color, width=border_width)
     if bbox_coords and all(coord is not None for coord in bbox_coords):
         x1, y1, x2, y2 = bbox_coords
+        # Bounding Box zeichnen
         draw.rectangle([x1, y1, x2, y2], outline=box_color, width=3)
+        # Modus-Text anzeigen
         text_color = (255, 255, 255)
+        # Text-Hintergrund zeichnen
         text_bbox = draw.textbbox((x1, y1 - 25), mode_text)
         draw.rectangle([text_bbox[0]-5, text_bbox[1]-2, text_bbox[2]+5, text_bbox[3]+2],
+                      fill=text_bg_color)
+        # Text zeichnen
         draw.text((x1, y1 - 25), mode_text, fill=text_color)
     return preview
+def update_live_preview(image, bbox_x1, bbox_y1, bbox_x2, bbox_y2, mode):
+    """
+    Aktualisiert die Live-Vorschau bei Koordinaten-Änderungen
+    NEU: Verwendet 3 Modi statt Boolean
+    """
     if image is None:
         return None
     bbox_coords = [bbox_x1, bbox_y1, bbox_x2, bbox_y2]
+    return create_preview_image(image, bbox_coords, mode)
 def process_image_upload(image):
     """Verarbeitet Bild-Upload und gibt Bild + Koordinaten zurück"""
     bbox = auto_detect_face_area(image)
     bbox_x1, bbox_y1, bbox_x2, bbox_y2 = bbox
+    # Standardmodus: "environment_change" (Umgebung ändern)
+    preview = create_preview_image(image, bbox, "environment_change")
     return preview, bbox_x1, bbox_y1, bbox_x2, bbox_y2
+# === HAUPTFUNKTIONEN (ANGEPASST FÜR 3 MODI) ===
 def text_to_image(prompt, model_id, steps, guidance_scale, progress=gr.Progress()):
     try:
         if not prompt or not prompt.strip():
         return None, error_msg
 def img_to_image(image, prompt, neg_prompt, strength, steps, guidance_scale,
+                 mode, bbox_x1, bbox_y1, bbox_x2, bbox_y2,
                  progress=gr.Progress()):
+    """
+    HAUPTFUNKTION FÜR BILD-zu-BILD (ANGEPASST FÜR 3 MODI)
+    WICHTIG: Der 'mode' Parameter bestimmt:
+    - "environment_change": Depth + Canny, Maske außen weiß
+    - "focus_change": OpenPose + Canny, Maske innen weiß
+    - "face_only_change": Depth + Canny, Maske innen weiß
+    keep_environment Parameter für ControlNet:
+    - True für "environment_change" und "face_only_change" (Depth+Canny)
+    - False für "focus_change" (OpenPose+Canny)
+    """
     try:
         if image is None:
             return None
         import time, random
         start_time = time.time()
+        print(f"🚀 Img2Img Start → Modus: {mode}")
+        print(f"📊 Einstellungen: Strength: {strength}, Steps: {steps}, Guidance: {guidance_scale}")
+        print(f"📝 Prompt: {prompt}")
+        print(f"🚫 Negativ-Prompt: {neg_prompt}")
+                 # ===== AUTOMATISCHEN NEGATIV-PROMPT GENERIEREN =====
         auto_negatives = auto_negative_prompt(prompt)
         print(f"🤖 Automatisch generierter Negativ-Prompt: {auto_negatives}")
+        # ===== KOMBINIERE MANUELLEN UND AUTOMATISCHEN PROMPT =====
         combined_negative_prompt = ""
         if neg_prompt and neg_prompt.strip():
             print(f"👤 Benutzer Negativ-Prompt: {user_neg}")
             # Entferne Duplikate zwischen automatischen und manuellen Prompts
             user_words = [word.strip().lower() for word in user_neg.split(",")]
             auto_words = [word.strip().lower() for word in auto_negatives.split(",")]
                 if auto_word and auto_word not in user_words:
                     combined_words.append(auto_word)
+            # Zusammenfügen und Duplikate entfernen
             unique_words = []
             seen_words = set()
             for word in combined_words:
             print(f"ℹ️ Kein manueller Negativ-Prompt, verwende nur automatischen: {combined_negative_prompt}")
         print(f"✅ Finaler kombinierter Negativ-Prompt: {combined_negative_prompt}")
         progress(0, desc="Starte Generierung mit ControlNet...")
+        # ===== MODUS-SPEZIFISCHE EINSTELLUNGEN =====
         adj_strength = min(0.85, strength * 1.25)
+        # Bestimme keep_environment basierend auf Modus
+        if mode == "focus_change":
+            # MODUS 2: Focus verändern → OpenPose + Canny
+            keep_environment = False
             controlnet_strength = adj_strength * 0.5
+            print(f"🎯 MODUS: Focus verändern → OpenPose+Canny (keep_environment=False)")
+        else:
+            # MODUS 1 & 3: Umgebung/Gesicht ändern → Depth + Canny
+            keep_environment = True
+            controlnet_strength = adj_strength * 0.8
+            if mode == "environment_change":
+                print(f"🎯 MODUS: Umgebung ändern → Depth+Canny (keep_environment=True)")
+            else:
+                print(f"🎯 MODUS: Ausschließlich Gesicht → Depth+Canny (keep_environment=True)")
         controlnet_steps = min(25, int(steps * 0.8))
+        print(f"⚙️ ControlNet Settings: Strength={controlnet_strength:.3f}, Steps={controlnet_steps}")
         progress(0.05, desc="Erstelle ControlNet Maps...")
+        # ===== CONTROLNET AUFRUF =====
         controlnet_output, inpaint_input = controlnet_processor.generate_with_controlnet(
             image=image,
             prompt=prompt,
             guidance_scale=guidance_scale,
             controlnet_strength=controlnet_strength,
             progress=progress,
+            keep_environment=keep_environment  # Wichtig: Bestimmt ControlNet Typ!
         )
         print(f"✅ ControlNet Output erhalten: {type(controlnet_output)}")
         adj_guidance = min(guidance_scale, 12.0)
         seed = random.randint(0, 2**32 - 1)
         generator = torch.Generator(device=device).manual_seed(seed)
+        print(f"🌱 Inpaint Seed: {seed}")
+        # ===== MASKE ERSTELLEN (BASIEREND AUF MODUS) =====
         mask = None
         if bbox_x1 and bbox_y1 and bbox_x2 and bbox_y2:
             orig_w, orig_h = image.size
                 int(bbox_x2 * scale_x),
                 int(bbox_y2 * scale_y)
             ]
+            print(f"📐 Skalierte Koordinaten: {bbox_coords}")
+            # NEU: Modus-spezifische Maskenerstellung
+            mask = create_face_mask(img_resized, bbox_coords, mode)
             if mask:
+                print(f"✅ Maske erstellt für Modus: {mode}")
         else:
             print("⚠️ Keine gültigen Koordinaten – keine Maske")
         callback = ImageToImageProgressCallback(progress, int(steps), adj_strength)
+        # ===== INPAINT DURCHFÜHREN =====
         result = pipe(
             prompt=prompt,
             negative_prompt=combined_negative_prompt,
         )
         end_time = time.time()
+        duration = end_time - start_time
+        print(f"✅ Transformation abgeschlossen in {duration:.2f} Sekunden")
+        print(f"🎯 Verwendeter Modus: {mode}")
+        print(f"⚙️ ControlNet: {'Depth+Canny' if keep_environment else 'OpenPose+Canny'}")
         generated_image = result.images[0]
         return generated_image
     )
 def main_ui():
+    """
+    HAUPT-UI (ANGEPASST FÜR 3 MODI)
+    Wichtigste Änderung: Ersetzung der Checkbox durch Radio-Buttons
+    """
     with gr.Blocks(
         title="AI Image Generator",
         theme=gr.themes.Base(),
             color: #721c24;
             border: 1px solid #f5c6cb;
         }
+        .radio-group {
+            background: #f8f9fa;
+            padding: 15px;
+            border-radius: 8px;
+            margin: 10px 0;
+            border: 2px solid #e9ecef;
+        }
+        .radio-item {
+            padding: 8px 12px;
+            margin: 5px 0;
+            border-radius: 4px;
+            transition: background 0.3s;
+        }
+        .radio-item:hover {
+            background: #e9ecef;
+        }
+        .radio-label {
+            font-weight: 600;
+            font-size: 14px;
+        }
+        .radio-description {
+            font-size: 12px;
+            color: #6c757d;
+            margin-left: 24px;
+        }
         """
     ) as demo:
                 )
             with gr.Tab("Bild zu Bild"):
+                gr.Markdown("## 🖼️ Bild zu Bild Transformation (3 MODI)")
                 with gr.Row():
                     with gr.Column():
                             show_download_button=False
                         )
+                # ===== NEUE RADIO-BUTTONS STATT CHECKBOX =====
                 with gr.Row():
+                    with gr.Column():
+                        gr.Markdown("### 🎛️ Transformations-Modus")
+                        # NEU: 3 Radio-Buttons statt 1 Checkbox
+                        mode_radio = gr.Radio(
+                            choices=[
+                                ("🌳 Umgebung ändern", "environment_change"),
+                                ("🎯 Focus verändern", "focus_change"),
+                                ("👤 Ausschließlich Gesicht", "face_only_change")
+                            ],
+                            value="environment_change",  # Standardmodus
+                            label="Wähle den Transformationsmodus:",
+                            info="Steuert, welcher Teil des Bildes verändert wird",
+                            elem_classes="radio-group"
+                        )
+                        # Detailierte Erklärungen
+                        gr.Markdown("""
+                        <div style="font-size: 12px; color: #666; margin-top: 10px;">
+                        <strong>Modus-Erklärungen:</strong><br>
+                        • <strong>🌳 Umgebung ändern:</strong> Ändert alles AUSSER dem Gesicht (Depth+Canny)<br>
+                        • <strong>🎯 Focus verändern:</strong> Ändert Gesicht+Körper (OpenPose+Canny)<br>
+                        • <strong>👤 Ausschließlich Gesicht:</strong> Ändert NUR das Gesicht (Depth+Canny)
+                        </div>
+                        """)
                 with gr.Row():
                     gr.Markdown("### 📐 Bildelementbereich anpassen")
                 with gr.Row():
                    gr.Markdown(
                      "### 📋 Hinweise:\n"
+                     "• **🆕 3 Transformations-Modi** für präzise Kontrolle\n"
                      "• **🆕 Automatische Bildelementerkennung** setzt Koordinaten beim Upload\n"
+                     "• **🆕 Live-Vorschau** zeigt farbige Rahmen je nach Modus\n"
                      "• **🆕 Koordinaten-Schieberegler** für präzise Anpassung mit Live-Update\n"
+                     "• **ControlNet-Technologie** für konsistente Ergebnisse\n"
+                     "• **Automatische Negative Prompts** für bessere Qualität"
                     )
                 transform_btn = gr.Button("🔄 Bild transformieren", variant="primary")
                     outputs=[preview_output, bbox_x1, bbox_y1, bbox_x2, bbox_y2]
                 )
+                # NEUE Input-Liste mit mode_radio statt face_preserve
+                coordinate_inputs = [img_input, bbox_x1, bbox_y1, bbox_x2, bbox_y2, mode_radio]
+                # Live-Vorschau Updates für alle Steuerelemente
                 for slider in [bbox_x1, bbox_y1, bbox_x2, bbox_y2]:
                     slider.change(
                         fn=update_live_preview,
                         outputs=preview_output
                     )
+                # NEU: Mode-Radio-Button ändert auch Live-Vorschau
+                mode_radio.change(
                     fn=update_live_preview,
                     inputs=coordinate_inputs,
                     outputs=preview_output
                 )
+                # NEU: Transform-Button mit mode_radio statt face_preserve
                 transform_btn.click(
                     fn=img_to_image,
                     inputs=[
                         img_input, img_prompt, img_neg_prompt,
                         strength_slider, img_steps, img_guidance,
+                        mode_radio, bbox_x1, bbox_y1, bbox_x2, bbox_y2
                     ],
                     outputs=img_output,
                     concurrency_limit=1
         show_error=True,
         share=False,
         ssr_mode=False  # SSR deaktivieren für Stabilität
+    )