Portx
/

trial-multi-model

Model card Files Files and versions

Portx commited on Mar 2, 2025

Commit

85ff963

·

verified ·

1 Parent(s): 8442a03

Update handler.py

Files changed (1) hide show

handler.py +3 -5

handler.py CHANGED Viewed

@@ -6,18 +6,16 @@ import os
 #run("pip install flash-attn --no-build-isolation", shell=True, check=True)
 run("pip install -U bitsandbytes", shell=True, check=True)
-def restart_script():
-    python = sys.executable
-    os.execl(python, python, *sys.argv)
-restart_script()
 from transformers import AutoModelForVision2Seq, AutoProcessor, BitsAndBytesConfig
 model_id = "ibm-granite/granite-vision-3.2-2b"
 bnb_config = BitsAndBytesConfig(
-        load_in_8bit=True,
         llm_int8_skip_modules=["vision_tower", "lm_head"],
         llm_int8_enable_fp32_cpu_offload=True
 )

 #run("pip install flash-attn --no-build-isolation", shell=True, check=True)
 run("pip install -U bitsandbytes", shell=True, check=True)
+run("pip install --upgrade pip", shell=True, check=True)
 from transformers import AutoModelForVision2Seq, AutoProcessor, BitsAndBytesConfig
 model_id = "ibm-granite/granite-vision-3.2-2b"
 bnb_config = BitsAndBytesConfig(
+        load_in_4bit=True,
         llm_int8_skip_modules=["vision_tower", "lm_head"],
         llm_int8_enable_fp32_cpu_offload=True
 )