Spaces:

Monimoy
/

fine_tuned_phi2_model

Runtime error

Monimoy commited on Mar 9, 2025

Commit

7ea9b97

verified ·

1 Parent(s): 7cd74fe

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -15,7 +15,7 @@ peft_model_path = "./phi2-openassistant-lora-final"
 # Load the base model with 4-bit quantization
 #bnb_config = BitsAndBytesConfig(load_in_4bit=True)  # Ensure compatibility
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, quantization_config=bnb_config, device_map={"": device})
-#base_model = AutoModelForCausalLM.from_pretrained(base_model_name, torch_dtype=torch.float32, device_map={"": device})
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, load_in_4bit=True, device_map={"": device})
 #bnb_config = BitsAndBytesConfig(
 #load_in_4bit=True,
@@ -25,7 +25,7 @@ peft_model_path = "./phi2-openassistant-lora-final"
 #)
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, quantization_config=bnb_config, device_map={"": device})
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, model_type="llama", device_map={"": device}, quantization="4bit")
-base_model = AutoModelForCausalLM.from_pretrained(base_model_name, load_in_4bit=True, device_map={"": device}, torch_dtype=torch.float16)

 # Load the base model with 4-bit quantization
 #bnb_config = BitsAndBytesConfig(load_in_4bit=True)  # Ensure compatibility
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, quantization_config=bnb_config, device_map={"": device})
+base_model = AutoModelForCausalLM.from_pretrained(base_model_name, torch_dtype=torch.float32, device_map={"": device})
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, load_in_4bit=True, device_map={"": device})
 #bnb_config = BitsAndBytesConfig(
 #load_in_4bit=True,
 #)
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, quantization_config=bnb_config, device_map={"": device})
 #base_model = AutoModelForCausalLM.from_pretrained(base_model_name, model_type="llama", device_map={"": device}, quantization="4bit")
+#base_model = AutoModelForCausalLM.from_pretrained(base_model_name, load_in_4bit=True, device_map={"": device}, torch_dtype=torch.float16)