pixagram-dev

Runtime error

App Files Files Community

primerz commited on Nov 1

Commit

99cd3f0

verified ·

1 Parent(s): 23a92a2

Update generator.py

Browse files

Files changed (1) hide show

generator.py +20 -17

generator.py CHANGED Viewed

@@ -20,7 +20,10 @@ from utils import (
 )
 from models import (
     load_face_analysis, load_depth_detector, load_controlnets, load_image_encoder,
-    load_sdxl_pipeline, load_loras, setup_ip_adapter, setup_compel,
     setup_scheduler, optimize_pipeline, load_caption_model, set_clip_skip,
     load_openpose_detector, load_mediapipe_face_detector
 )
@@ -127,8 +130,9 @@ class RetroArtConverter:
             self.models_loaded['ip_adapter'] = False
             self.image_proj_model = None
-        # Setup Compel
-        self.compel, self.use_compel = setup_compel(self.pipe)
         # Setup LCM scheduler
         setup_scheduler(self.pipe)
@@ -773,29 +777,28 @@ class RetroArtConverter:
         pipe_kwargs["generator"] = generator
-        # --- START FIX: Use CompelForSDXL as per documentation ---
-        # This fixes the "TypeError" and the "93 vs 77" error
-        if self.use_compel and self.compel is not None:
             try:
-                print("Encoding prompts with Compel...")
-                # Call Compel with prompt and negative_prompt kwargs
-                # Compel will handle the padding internally
-                conditioning = self.compel(prompt, negative_prompt=negative_prompt)
-                # Unpack the results from the returned object
                 pipe_kwargs["prompt_embeds"] = conditioning.embeds
                 pipe_kwargs["pooled_prompt_embeds"] = conditioning.pooled_embeds
                 pipe_kwargs["negative_prompt_embeds"] = conditioning.negative_embeds
                 pipe_kwargs["negative_pooled_prompt_embeds"] = conditioning.negative_pooled_embeds
-                print(f"[OK] Compel encoded - Prompt: {pipe_kwargs['prompt_embeds'].shape}, Negative: {pipe_kwargs['negative_prompt_embeds'].shape}")
             except Exception as e:
-                print(f"Compel encoding failed, using standard prompts: {e}")
                 traceback.print_exc()
                 pipe_kwargs["prompt"] = prompt
                 pipe_kwargs["negative_prompt"] = negative_prompt
         else:
             pipe_kwargs["prompt"] = prompt
             pipe_kwargs["negative_prompt"] = negative_prompt
         # --- END FIX ---
@@ -842,8 +845,8 @@ class RetroArtConverter:
                         print(f"  - Face embedding: {face_proj_embeds.shape}, Scale: {boosted_scale:.2f}")
-                        # --- START FIX 2: Your padding solution ---
-                        # This fixes the "109 vs 93" error
                         if 'prompt_embeds' in pipe_kwargs:
                             original_embeds = pipe_kwargs['prompt_embeds']
@@ -870,7 +873,7 @@ class RetroArtConverter:
                             print(f"  [OK] Face embeddings concatenated successfully! Prompt: {combined_embeds.shape}")
                         else:
-                            print(f"  [WARNING] Can't concatenate - no prompt_embeds (use Compel)")
                         # --- END FIX 2 ---
                 elif has_detected_faces:
@@ -947,4 +950,4 @@ class RetroArtConverter:
         return generated_image
-print("[OK] Generator class ready")

 )
 from models import (
     load_face_analysis, load_depth_detector, load_controlnets, load_image_encoder,
+    load_sdxl_pipeline, load_loras, setup_ip_adapter,
+    # --- START FIX: Import setup_cappella ---
+    setup_cappella,
+    # --- END FIX ---
     setup_scheduler, optimize_pipeline, load_caption_model, set_clip_skip,
     load_openpose_detector, load_mediapipe_face_detector
 )
             self.models_loaded['ip_adapter'] = False
             self.image_proj_model = None
+        # --- START FIX: Setup Cappella ---
+        self.cappella, self.use_cappella = setup_cappella(self.pipe)
+        # --- END FIX ---
         # Setup LCM scheduler
         setup_scheduler(self.pipe)
         pipe_kwargs["generator"] = generator
+        # --- START FIX: Use our new Cappella module ---
+        if self.use_cappella and self.cappella is not None:
             try:
+                print("Encoding prompts with Cappella...")
+                # Call Cappella once. It handles truncation and padding.
+                conditioning = self.cappella(prompt, negative_prompt)
+                # Unpack the results
                 pipe_kwargs["prompt_embeds"] = conditioning.embeds
                 pipe_kwargs["pooled_prompt_embeds"] = conditioning.pooled_embeds
                 pipe_kwargs["negative_prompt_embeds"] = conditioning.negative_embeds
                 pipe_kwargs["negative_pooled_prompt_embeds"] = conditioning.negative_pooled_embeds
+                print(f"[OK] Cappella encoded - Prompt: {pipe_kwargs['prompt_embeds'].shape}, Negative: {pipe_kwargs['negative_prompt_embeds'].shape}")
             except Exception as e:
+                print(f"Cappella encoding failed, using standard prompts: {e}")
                 traceback.print_exc()
                 pipe_kwargs["prompt"] = prompt
                 pipe_kwargs["negative_prompt"] = negative_prompt
         else:
+            print("[WARNING] Cappella not found, using standard prompt encoding.")
             pipe_kwargs["prompt"] = prompt
             pipe_kwargs["negative_prompt"] = negative_prompt
         # --- END FIX ---
                         print(f"  - Face embedding: {face_proj_embeds.shape}, Scale: {boosted_scale:.2f}")
+                        # --- START FIX: Your padding solution ---
+                        # This fixes the "109 vs 77" error
                         if 'prompt_embeds' in pipe_kwargs:
                             original_embeds = pipe_kwargs['prompt_embeds']
                             print(f"  [OK] Face embeddings concatenated successfully! Prompt: {combined_embeds.shape}")
                         else:
+                            print(f"  [WARNING] Can't concatenate - no prompt_embeds (use Cappella)")
                         # --- END FIX 2 ---
                 elif has_detected_faces:
         return generated_image
+print("[OK] Generator class ready")