Spaces:

wt3639
/

Course_rec

Paused

Tao Wu commited on Jul 2, 2024

Commit

28a9b71

1 Parent(s): 032427b

quantization

Files changed (1) hide show

app/embedding_setup.py CHANGED Viewed

@@ -40,7 +40,7 @@ quantization_config = BitsAndBytesConfig(
     bnb_4bit_quant_type="nf4"
 )
-tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL, quantization_config=quantization_config, token=hf_auth)
 first_token = 'First'
@@ -50,6 +50,7 @@ first_id = tokenizer.convert_tokens_to_ids(first_token)
 second_id = tokenizer.convert_tokens_to_ids(second_token)
 model = AutoModelForCausalLM.from_pretrained(
             LLM_MODEL,
             torch_dtype=torch.float16,
             device_map="auto",
             token=hf_auth,

     bnb_4bit_quant_type="nf4"
 )
+tokenizer = AutoTokenizer.from_pretrained(LLM_MODEL, token=hf_auth)
 first_token = 'First'
 second_id = tokenizer.convert_tokens_to_ids(second_token)
 model = AutoModelForCausalLM.from_pretrained(
             LLM_MODEL,
+             quantization_config=quantization_config,
             torch_dtype=torch.float16,
             device_map="auto",
             token=hf_auth,