Spaces:

roll-ai
/

Sci-Fi

Paused

App Files Files Community

AhmadMustafa commited on Oct 3

Commit

41e1888

1 Parent(s): daaccd0

rename

Browse files

Files changed (1) hide show

app.py +24 -7

app.py CHANGED Viewed

@@ -1,4 +1,6 @@
 import time
 import gradio as gr
 import spaces
@@ -18,7 +20,7 @@ device = "cuda" if torch.cuda.is_available() else "cpu"
 def _load_pipeline_internal(
-    pretrained_model_path="THUDM/CogVideoX-5b",
     ef_net_path="weights/EF_Net.pth",
     dtype_str="bfloat16",
 ):
@@ -31,19 +33,34 @@ def _load_pipeline_internal(
     dtype = torch.float16 if dtype_str == "float16" else torch.bfloat16
-    # Load models
     tokenizer = T5Tokenizer.from_pretrained(
-        pretrained_model_path, subfolder="tokenizer"
     )
     text_encoder = T5EncoderModel.from_pretrained(
-        pretrained_model_path, subfolder="text_encoder"
     )
     transformer = CustomCogVideoXTransformer3DModel.from_pretrained(
-        pretrained_model_path, subfolder="transformer"
     )
-    vae = AutoencoderKLCogVideoX.from_pretrained(pretrained_model_path, subfolder="vae")
     scheduler = CogVideoXDDIMScheduler.from_pretrained(
-        pretrained_model_path, subfolder="scheduler"
     )
     # Load EF-Net

 import time
+import os
+from huggingface_hub import hf_hub_download
 import gradio as gr
 import spaces
 def _load_pipeline_internal(
+    pretrained_model_path="LiuhanChen/Sci-Fi",
     ef_net_path="weights/EF_Net.pth",
     dtype_str="bfloat16",
 ):
     dtype = torch.float16 if dtype_str == "float16" else torch.bfloat16
+    # Download EF-Net weights if not exists
+    if not os.path.exists(ef_net_path):
+        print("Downloading EF-Net weights from Hugging Face...")
+        os.makedirs("weights", exist_ok=True)
+        ef_net_path = hf_hub_download(
+            repo_id="LiuhanChen/Sci-Fi",
+            subfolder="EF_Net",
+            filename="EF_Net.pth",
+            local_dir="weights"
+        )
+        ef_net_path = "weights/EF_Net/EF_Net.pth"
+        print(f"EF-Net weights downloaded to {ef_net_path}")
+    # Load models from Hugging Face
     tokenizer = T5Tokenizer.from_pretrained(
+        pretrained_model_path, subfolder="CogVideoX-5b-I2V/tokenizer"
     )
     text_encoder = T5EncoderModel.from_pretrained(
+        pretrained_model_path, subfolder="CogVideoX-5b-I2V/text_encoder"
     )
     transformer = CustomCogVideoXTransformer3DModel.from_pretrained(
+        pretrained_model_path, subfolder="CogVideoX-5b-I2V/transformer"
+    )
+    vae = AutoencoderKLCogVideoX.from_pretrained(
+        pretrained_model_path, subfolder="CogVideoX-5b-I2V/vae"
     )
     scheduler = CogVideoXDDIMScheduler.from_pretrained(
+        pretrained_model_path, subfolder="CogVideoX-5b-I2V/scheduler"
     )
     # Load EF-Net