Spaces:

DawnC
/

VividFlow

Sleeping

App Files Files Community

DawnC commited on Dec 27, 2025

Commit

cf1b6d7

verified ·

1 Parent(s): 7550e7c

Upload 2 files

Browse files

Files changed (2) hide show

VideoEngine.py +6 -12
app.py +6 -0

VideoEngine.py CHANGED Viewed

@@ -29,13 +29,6 @@ from diffusers.pipelines.wan.pipeline_wan_i2v import WanImageToVideoPipeline
 from diffusers.models.transformers.transformer_wan import WanTransformer3DModel
 from diffusers.utils.export_utils import export_to_video
-# Optional dependency for AOTI (HF Spaces deployment only)
-try:
-    from spaces.zero.torch.aoti import aoti_blocks_load
-    HAS_AOTI = True
-except ImportError:
-    HAS_AOTI = False
 class VideoEngine:
     """
@@ -167,14 +160,13 @@ class VideoEngine:
             print("→ [6/7] Skipping AOTI (testing mode, not needed)")
             return
-        if not HAS_AOTI:
-            print("⚠ [6/7] Skipping AOTI (spaces.zero.torch.aoti not available)")
-            return
         print("→ [6/7] Loading AOTI pre-compiled blocks...")
         try:
             # Determine variant based on GPU capability
-            variant = 'int8'  # Default
             if torch.cuda.is_available():
                 cuda_cap = torch.cuda.get_device_capability()
                 fp8_supported = cuda_cap[0] > 8 or (cuda_cap[0] == 8 and cuda_cap[1] >= 9)
@@ -185,6 +177,8 @@ class VideoEngine:
             aoti_blocks_load(self.pipeline.transformer, 'zerogpu-aoti/Wan2', variant=variant)
             aoti_blocks_load(self.pipeline.transformer_2, 'zerogpu-aoti/Wan2', variant=variant)
             print(f"✓ AOTI blocks loaded (variant: {variant}, 60-70% speedup)")
         except Exception as e:
             print(f"⚠ AOTI load failed (falling back to standard inference): {e}")
             print("  This is not critical, speed will be slightly slower")

 from diffusers.models.transformers.transformer_wan import WanTransformer3DModel
 from diffusers.utils.export_utils import export_to_video
 class VideoEngine:
     """
             print("→ [6/7] Skipping AOTI (testing mode, not needed)")
             return
         print("→ [6/7] Loading AOTI pre-compiled blocks...")
         try:
+            # Lazy import to avoid CUDA initialization at module load
+            from spaces.zero.torch.aoti import aoti_blocks_load
             # Determine variant based on GPU capability
+            variant = 'int8'
             if torch.cuda.is_available():
                 cuda_cap = torch.cuda.get_device_capability()
                 fp8_supported = cuda_cap[0] > 8 or (cuda_cap[0] == 8 and cuda_cap[1] >= 9)
             aoti_blocks_load(self.pipeline.transformer, 'zerogpu-aoti/Wan2', variant=variant)
             aoti_blocks_load(self.pipeline.transformer_2, 'zerogpu-aoti/Wan2', variant=variant)
             print(f"✓ AOTI blocks loaded (variant: {variant}, 60-70% speedup)")
+        except ImportError:
+            print("⚠ [6/7] Skipping AOTI (spaces.zero.torch.aoti not available)")
         except Exception as e:
             print(f"⚠ AOTI load failed (falling back to standard inference): {e}")
             print("  This is not critical, speed will be slightly slower")

app.py CHANGED Viewed

@@ -1,6 +1,12 @@
 import os
 import sys
 sys.stdout.flush()
 import functools
 print = functools.partial(print, flush=True)

 import os
 import sys
+# CRITICAL: Import spaces FIRST before any CUDA initialization
+try:
+    import spaces
+except ImportError:
+    pass
 sys.stdout.flush()
 import functools
 print = functools.partial(print, flush=True)