Spaces:

ruslanmv
/

Hotel-Recommendation-Multimodal

Paused

ruslanmv commited on Aug 14, 2024

Commit

22e4d02

1 Parent(s): d4ba9d9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,10 +34,11 @@ print(f"Using device: {DEVICE}")
 print(f"Low memory: {LOW_MEMORY}")
 # Quantization configuration for efficient model loading
-quantization_config = BitsAndBytesConfig(
-    load_in_4bit=True,
-    bnb_4bit_compute_dtype=torch.float16
-)
 # Load models only once
 processor = AutoProcessor.from_pretrained(MODEL_ID)

 print(f"Low memory: {LOW_MEMORY}")
 # Quantization configuration for efficient model loading
+# Define BitsAndBytesConfig
+quantization_config = BitsAndBytesConfig(load_in_4bit=True,
+                                bnb_4bit_quant_type="nf4",
+                                bnb_4bit_compute_dtype=torch.float16)
 # Load models only once
 processor = AutoProcessor.from_pretrained(MODEL_ID)