Spaces:

CGQN
/

MiniCPM-V-4_5-int4-CPU-0

Running

CGQN commited on Aug 28

Commit

71021b9

verified ·

1 Parent(s): 547dee4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -32,6 +32,7 @@ def load_model():
         attn_implementation="sdpa",  # SDPA is fine on CPU; avoid flash-attn on CPU
         torch_dtype=torch.float32,   # Safer default for CPU
         device_map="cpu"             # Ensure CPU execution
     )
     model.eval()

         attn_implementation="sdpa",  # SDPA is fine on CPU; avoid flash-attn on CPU
         torch_dtype=torch.float32,   # Safer default for CPU
         device_map="cpu"             # Ensure CPU execution
+        quantization_config=None,
     )
     model.eval()