Spaces:

OmniSVG
/

OmniSVG-3B

Running on Zero

OmniSVG commited on Dec 2, 2025

Commit

3d22eb7

verified ·

1 Parent(s): a6f884b

Update decoder.py

Files changed (1) hide show

decoder.py CHANGED Viewed

@@ -1,7 +1,8 @@
 import torch.nn as nn
 import torch
-from transformers import Qwen2_5_VLForConditionalGeneration, AutoConfig
 class SketchDecoder(nn.Module):
   """
   Autoregressive generative model
@@ -23,10 +24,17 @@ class SketchDecoder(nn.Module):
           eos_token_id=self.eos_token_id,
           pad_token_id=self.pad_token_id)
     self.transformer = Qwen2_5_VLForConditionalGeneration.from_pretrained(
         "Qwen/Qwen2.5-VL-3B-Instruct",
         config=config,
-        torch_dtype=torch.bfloat16, attn_implementation="flash_attention_2",
         device_map ="cuda",
         ignore_mismatched_sizes=True
     )

 import torch.nn as nn
 import torch
+from transformers import Qwen2_5_VLForConditionalGeneration, AutoConfig，BitsAndBytesConfig
 class SketchDecoder(nn.Module):
   """
   Autoregressive generative model
           eos_token_id=self.eos_token_id,
           pad_token_id=self.pad_token_id)
+    quantization_config = BitsAndBytesConfig(
+        load_in_4bit=True,
+        bnb_4bit_compute_dtype=torch.float16,
+        bnb_4bit_quant_type="nf4"
+    )
     self.transformer = Qwen2_5_VLForConditionalGeneration.from_pretrained(
         "Qwen/Qwen2.5-VL-3B-Instruct",
         config=config,
+        quantization_config=quantization_config,
+        torch_dtype=torch.bfloat16, attn_implementation="sdpa",
         device_map ="cuda",
         ignore_mismatched_sizes=True
     )