Spaces:

pmelnechuk
/

MathQA

Sleeping

pmelnechuk commited on Feb 21, 2025

Commit

881820d

verified ·

1 Parent(s): 1fffd44

Update src/model_load.py

Files changed (1) hide show

src/model_load.py CHANGED Viewed

@@ -9,13 +9,13 @@ from langchain.chains import LLMChain
 def load_model():
     model_name="tiiuae/Falcon3-10B-Instruct"
-    max_memory = {0: "23GB", "cpu": "30GB"}
     # Cargar tokenizer y modelo de Hugging Face
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name,
                                                  device_map="auto",
                                                  quantization_config=BitsAndBytesConfig(load_in_8bit=True),
-                                                 torch_dtype=torch.float8,
                                                  max_memory=max_memory)
     # Crear pipeline de generación de texto

 def load_model():
     model_name="tiiuae/Falcon3-10B-Instruct"
+    max_memory = {0: "24GB", "cpu": "30GB"}
     # Cargar tokenizer y modelo de Hugging Face
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name,
                                                  device_map="auto",
                                                  quantization_config=BitsAndBytesConfig(load_in_8bit=True),
+                                                 torch_dtype=torch.float16,
                                                  max_memory=max_memory)
     # Crear pipeline de generación de texto