Spaces:

Astridkraft
/

Stable-ControlNet-GPU

Paused

App Files Files Community

Astridkraft commited on Nov 12, 2025

Commit

7e166d0

verified ·

1 Parent(s): 44bdb5e

Update controlnet_module.py

Browse files

Files changed (1) hide show

controlnet_module.py +81 -58

controlnet_module.py CHANGED Viewed

@@ -7,23 +7,25 @@ import cv2
 import numpy as np
 import gradio as gr
 class ControlNetProgressCallback:
     def __init__(self, progress, total_steps):
         self.progress = progress
         self.total_steps = total_steps
         self.current_step = 0
     def __call__(self, pipe, step_index, timestep, callback_kwargs):
         self.current_step = step_index + 1
         progress_percentage = self.current_step / self.total_steps
         # Fortschritt aktualisieren
         if self.progress is not None:
             self.progress(progress_percentage, desc=f"ControlNet: Schritt {self.current_step}/{self.total_steps}")
         print(f"ControlNet Fortschritt: {self.current_step}/{self.total_steps} ({progress_percentage:.1%})")
         return callback_kwargs
 class ControlNetProcessor:
     def __init__(self, device="cuda", torch_dtype=torch.float32):
         self.device = device
@@ -31,99 +33,120 @@ class ControlNetProcessor:
         self.pose_detector = None
         self.controlnet = None
         self.pipe = None
     def load_pose_detector(self):
         """Lädt nur den Pose-Detector"""
         if self.pose_detector is None:
             print("Loading Pose Detector...")
             try:
-                self.pose_detector = OpenposeDetector.from_pretrained(
-                    "lllyasviel/ControlNet",
-                )
             except Exception as e:
                 print(f"Warnung: Pose-Detector konnte nicht geladen werden: {e}")
         return self.pose_detector
     def extract_pose_simple(self, image):
         """Einfache Pose-Extraktion ohne komplexe Abhängigkeiten"""
         try:
             img_array = np.array(image.convert("RGB"))
             edges = cv2.Canny(img_array, 100, 200)
             pose_image = Image.fromarray(edges).convert("RGB")
-            print("⚠️  Verwende Kanten-basierte Pose-Approximation")
             return pose_image
         except Exception as e:
             print(f"Fehler bei einfacher Pose-Extraktion: {e}")
             return image.convert("RGB").resize((512, 512))
     def extract_pose(self, image):
         """Extrahiert Pose-Map aus Bild mit Fallback"""
         try:
             detector = self.load_pose_detector()
             if detector is None:
                 return self.extract_pose_simple(image)
-            #pose_image = detector(image, hand_and_face=True, detect_resolution=512)
             pose_image = detector.detect(image, hand_and_face=True)
             return pose_image
         except Exception as e:
             print(f"Fehler bei Pose-Extraktion: {e}")
             return self.extract_pose_simple(image)
-    def generate_with_controlnet(self, image, prompt, negative_prompt,
-                               steps, guidance_scale, controlnet_strength, progress=None):
         """Generiert Bild mit ControlNet und Fortschrittsanzeige"""
         try:
-            # Pipeline laden
             pipe = self.load_controlnet_pipeline()
-            # Pose extrahieren
             print("🔄 ControlNet: Extrahiere Pose...")
             if progress:
                 progress(0.05, desc="ControlNet: Extrahiere Pose...")
-            pose_map = self.extract_pose(image)
             # Zufälliger Seed
             seed = random.randint(0, 2**32 - 1)
             generator = torch.Generator(device=self.device).manual_seed(seed)
             print(f"ControlNet Seed: {seed}")
-            # Progress Callback erstellen
-            callback = None
-            if progress is not None:
-                callback = ControlNetProgressCallback(progress, int(steps))
-            print("🔄 ControlNet: Wende Pose-Kontrolle an...")
-            # ControlNet anwenden mit Callback
-            result = pipe(
-                prompt=prompt,
-                image=pose_map,
-                negative_prompt=negative_prompt,
-                num_inference_steps=int(steps),
-                guidance_scale=guidance_scale,
-                generator=generator,
-                controlnet_conditioning_scale=controlnet_strength,
-                height=512,
-                width=512,
-                output_type="pil",
-                callback_on_step_end=callback,
-                callback_on_step_end_tensor_inputs=[],
-            )
-            # Debug-Ausgabe der tatsächlichen Steps
             try:
                 scheduler = pipe.scheduler
-                if hasattr(scheduler, 'timesteps'):
                     actual_steps = len(scheduler.timesteps)
                     print(f"🎯 CONTROLNET TATSÄCHLICHE STEPS: {actual_steps} (von {steps} angefordert)")
             except Exception as e:
-                print(f"⚠️  Konnte ControlNet Scheduler-Info nicht auslesen: {e}")
             print("✅ ControlNet abgeschlossen!")
             return result.images[0]
         except Exception as e:
             print(f"❌ Fehler in ControlNet: {e}")
             import traceback
@@ -136,7 +159,7 @@ class ControlNetProcessor:
             print("Loading ControlNet pipeline...")
             try:
                 self.controlnet = ControlNetModel.from_pretrained(
-                    "lllyasviel/sd-controlnet-openpose",
                     torch_dtype=self.torch_dtype
                 )
                 self.pipe = StableDiffusionControlNetPipeline.from_pretrained(
@@ -146,19 +169,19 @@ class ControlNetProcessor:
                     safety_checker=None,
                     requires_safety_checker=False
                 ).to(self.device)
-                from diffusers import DPMSolverMultistepScheduler
-                self.pipe.scheduler = DPMSolverMultistepScheduler.from_config(
-                    self.pipe.scheduler.config
-                )
                 self.pipe.enable_attention_slicing()
-                print("ControlNet pipeline loaded successfully!")
             except Exception as e:
                 print(f"Fehler beim Laden von ControlNet: {e}")
                 raise
         return self.pipe
 # Globale Instanz
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if device == "cuda" else torch.float32

 import numpy as np
 import gradio as gr
 class ControlNetProgressCallback:
     def __init__(self, progress, total_steps):
         self.progress = progress
         self.total_steps = total_steps
         self.current_step = 0
     def __call__(self, pipe, step_index, timestep, callback_kwargs):
         self.current_step = step_index + 1
         progress_percentage = self.current_step / self.total_steps
         # Fortschritt aktualisieren
         if self.progress is not None:
             self.progress(progress_percentage, desc=f"ControlNet: Schritt {self.current_step}/{self.total_steps}")
         print(f"ControlNet Fortschritt: {self.current_step}/{self.total_steps} ({progress_percentage:.1%})")
         return callback_kwargs
 class ControlNetProcessor:
     def __init__(self, device="cuda", torch_dtype=torch.float32):
         self.device = device
         self.pose_detector = None
         self.controlnet = None
         self.pipe = None
     def load_pose_detector(self):
         """Lädt nur den Pose-Detector"""
         if self.pose_detector is None:
             print("Loading Pose Detector...")
             try:
+                self.pose_detector = OpenposeDetector.from_pretrained("lllyasviel/ControlNet")
             except Exception as e:
                 print(f"Warnung: Pose-Detector konnte nicht geladen werden: {e}")
         return self.pose_detector
     def extract_pose_simple(self, image):
         """Einfache Pose-Extraktion ohne komplexe Abhängigkeiten"""
         try:
             img_array = np.array(image.convert("RGB"))
             edges = cv2.Canny(img_array, 100, 200)
             pose_image = Image.fromarray(edges).convert("RGB")
+            print("⚠️ Verwende Kanten-basierte Pose-Approximation")
             return pose_image
         except Exception as e:
             print(f"Fehler bei einfacher Pose-Extraktion: {e}")
             return image.convert("RGB").resize((512, 512))
     def extract_pose(self, image):
         """Extrahiert Pose-Map aus Bild mit Fallback"""
         try:
             detector = self.load_pose_detector()
             if detector is None:
                 return self.extract_pose_simple(image)
             pose_image = detector.detect(image, hand_and_face=True)
             return pose_image
         except Exception as e:
             print(f"Fehler bei Pose-Extraktion: {e}")
             return self.extract_pose_simple(image)
+    def generate_with_controlnet(
+        self, image, prompt, negative_prompt,
+        steps, guidance_scale, controlnet_strength,
+        progress=None, keep_environment=False
+    ):
         """Generiert Bild mit ControlNet und Fortschrittsanzeige"""
         try:
             pipe = self.load_controlnet_pipeline()
             print("🔄 ControlNet: Extrahiere Pose...")
             if progress:
                 progress(0.05, desc="ControlNet: Extrahiere Pose...")
+            # --- Fallunterscheidung ---
+            if keep_environment:
+                print("🎯 Modus: Umgebung beibehalten (nutze Originalbild als Quelle)")
+                input_image = image
+                conditioning_image = None
+            else:
+                print("🎯 Modus: Umgebung darf sich ändern (nutze Pose-Map)")
+                conditioning_image = self.extract_pose(image)
+                input_image = conditioning_image
             # Zufälliger Seed
             seed = random.randint(0, 2**32 - 1)
             generator = torch.Generator(device=self.device).manual_seed(seed)
             print(f"ControlNet Seed: {seed}")
+            # Fortschritt-Callback
+            callback = ControlNetProgressCallback(progress, int(steps)) if progress is not None else None
+            print("🔄 ControlNet: Starte Pipeline...")
+            if conditioning_image is not None:
+                # Umgebung darf sich ändern
+                result = pipe(
+                    prompt=prompt,
+                    image=conditioning_image,
+                    negative_prompt=negative_prompt,
+                    num_inference_steps=int(steps),
+                    guidance_scale=guidance_scale,
+                    generator=generator,
+                    controlnet_conditioning_scale=controlnet_strength,
+                    height=512,
+                    width=512,
+                    output_type="pil",
+                    callback_on_step_end=callback,
+                    callback_on_step_end_tensor_inputs=[],
+                )
+            else:
+                # Umgebung soll beibehalten werden
+                result = pipe(
+                    prompt=prompt,
+                    image=input_image,
+                    negative_prompt=negative_prompt,
+                    num_inference_steps=int(steps),
+                    guidance_scale=guidance_scale,
+                    generator=generator,
+                    controlnet_conditioning_scale=controlnet_strength,
+                    height=512,
+                    width=512,
+                    output_type="pil",
+                    callback_on_step_end=callback,
+                    callback_on_step_end_tensor_inputs=[],
+                )
+            # Debug-Ausgabe Scheduler Steps
             try:
                 scheduler = pipe.scheduler
+                if hasattr(scheduler, "timesteps"):
                     actual_steps = len(scheduler.timesteps)
                     print(f"🎯 CONTROLNET TATSÄCHLICHE STEPS: {actual_steps} (von {steps} angefordert)")
             except Exception as e:
+                print(f"⚠️ Konnte ControlNet Scheduler-Info nicht auslesen: {e}")
             print("✅ ControlNet abgeschlossen!")
             return result.images[0]
         except Exception as e:
             print(f"❌ Fehler in ControlNet: {e}")
             import traceback
             print("Loading ControlNet pipeline...")
             try:
                 self.controlnet = ControlNetModel.from_pretrained(
+                    "lllyasviel/sd-controlnet-openpose",
                     torch_dtype=self.torch_dtype
                 )
                 self.pipe = StableDiffusionControlNetPipeline.from_pretrained(
                     safety_checker=None,
                     requires_safety_checker=False
                 ).to(self.device)
+                # Scheduler wechseln zu Euler Ancestral
+                from diffusers import EulerAncestralDiscreteScheduler
+                self.pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(self.pipe.scheduler.config)
                 self.pipe.enable_attention_slicing()
+                print("✅ ControlNet pipeline loaded successfully with EulerAncestralDiscreteScheduler!")
             except Exception as e:
                 print(f"Fehler beim Laden von ControlNet: {e}")
                 raise
         return self.pipe
 # Globale Instanz
 device = "cuda" if torch.cuda.is_available() else "cpu"
 torch_dtype = torch.float16 if device == "cuda" else torch.float32