Spaces:

Kunbyte
/

DRA-Ctrl

Running on Zero

App Files Files Community

caohy666 commited on Jul 11

Commit

b187df6

1 Parent(s): 734f79a

<feat> lower RAM usage when loading models

Browse files

Files changed (1) hide show

app.py +8 -4

app.py CHANGED Viewed

@@ -59,23 +59,27 @@ def init_basemodel():
     transformer = HunyuanVideoTransformer3DModel.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                  subfolder="transformer",
                                                                  inference_subject_driven=False,
-                                                                 low_cpu_mem_usage=True).requires_grad_(False).to(device, dtype=weight_dtype)
     torch.cuda.empty_cache()
     gc.collect()
     scheduler = diffusers.FlowMatchEulerDiscreteScheduler()
     vae = diffusers.AutoencoderKLHunyuanVideo.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                               subfolder="vae",
-                                                              low_cpu_mem_usage=True).requires_grad_(False).to(device, dtype=weight_dtype)
     torch.cuda.empty_cache()
     gc.collect()
     text_encoder = transformers.LlavaForConditionalGeneration.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                               subfolder="text_encoder",
-                                                                              low_cpu_mem_usage=True).requires_grad_(False).to(device, dtype=weight_dtype)
     torch.cuda.empty_cache()
     gc.collect()
     text_encoder_2 = transformers.CLIPTextModel.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                 subfolder="text_encoder_2",
-                                                                low_cpu_mem_usage=True).requires_grad_(False).to(device, dtype=weight_dtype)
     torch.cuda.empty_cache()
     gc.collect()
     tokenizer = transformers.AutoTokenizer.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',

     transformer = HunyuanVideoTransformer3DModel.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                  subfolder="transformer",
                                                                  inference_subject_driven=False,
+                                                                 low_cpu_mem_usage=True,
+                                                                 torch_dtype=weight_dtype).requires_grad_(False).to(device)
     torch.cuda.empty_cache()
     gc.collect()
     scheduler = diffusers.FlowMatchEulerDiscreteScheduler()
     vae = diffusers.AutoencoderKLHunyuanVideo.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                               subfolder="vae",
+                                                              low_cpu_mem_usage=True,
+                                                              torch_dtype=weight_dtype).requires_grad_(False).to(device)
     torch.cuda.empty_cache()
     gc.collect()
     text_encoder = transformers.LlavaForConditionalGeneration.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                               subfolder="text_encoder",
+                                                                              low_cpu_mem_usage=True,
+                                                                              torch_dtype=weight_dtype).requires_grad_(False).to(device)
     torch.cuda.empty_cache()
     gc.collect()
     text_encoder_2 = transformers.CLIPTextModel.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',
                                                                 subfolder="text_encoder_2",
+                                                                low_cpu_mem_usage=True,
+                                                                torch_dtype=weight_dtype).requires_grad_(False).to(device)
     torch.cuda.empty_cache()
     gc.collect()
     tokenizer = transformers.AutoTokenizer.from_pretrained('hunyuanvideo-community/HunyuanVideo-I2V',