Fix: Implement deepseek moe for moe_impl == "eager" to solve oom.

#12

by tulvgengenr - opened Feb 3

←

Files changed (1) hide show

hunyuan_image_3_pipeline.py CHANGED Viewed

@@ -814,12 +814,17 @@ class HunyuanImage3Text2ImagePipeline(DiffusionPipeline):
         # Taylor cache
         cache_dic = None
         if self.model.use_taylor_cache:
-            cache_dic = cache_init(cache_interval=self.model.taylor_cache_interval, max_order=self.model.taylor_cache_order, num_steps=len(timesteps),
-                                enable_first_enhance=self.model.taylor_cache_enable_first_enhance, first_enhance_steps=self.model.taylor_cache_first_enhance_steps,
-                                enable_tailing_enhance=self.model.taylor_cache_enable_tailing_enhance,
-                                tailing_enhance_steps=self.model.taylor_cache_tailing_enhance_steps,
-                                low_freqs_order=self.model.taylor_cache_low_freqs_order,
-                                high_freqs_order=self.model.taylor_cache_high_freqs_order)
         print(f"***use_taylor_cache: {self.model.use_taylor_cache}, cache_dic: {cache_dic}")
         with self.progress_bar(total=num_inference_steps) as progress_bar:

         # Taylor cache
         cache_dic = None
         if self.model.use_taylor_cache:
+            cache_dic = cache_init(
+                cache_interval=self.model.taylor_cache_interval,
+                max_order=self.model.taylor_cache_order,
+                num_steps=len(timesteps),
+                enable_first_enhance=self.model.taylor_cache_enable_first_enhance,
+                first_enhance_steps=self.model.taylor_cache_first_enhance_steps,
+                enable_tailing_enhance=self.model.taylor_cache_enable_tailing_enhance,
+                tailing_enhance_steps=self.model.taylor_cache_tailing_enhance_steps,
+                low_freqs_order=self.model.taylor_cache_low_freqs_order,
+                high_freqs_order=self.model.taylor_cache_high_freqs_order
+            )
         print(f"***use_taylor_cache: {self.model.use_taylor_cache}, cache_dic: {cache_dic}")
         with self.progress_bar(total=num_inference_steps) as progress_bar: