text_generation

Runtime error

calvinchaochao commited on Aug 9, 2023

Commit

8ab373d

1 Parent(s): d652d06

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer,BitsAndBytesConfig
 from transformers.generation import GenerationConfig
 quantization_config = BitsAndBytesConfig(
             load_in_4bit=True,
-            bnb_4bit_quant_type='nf4',
             bnb_4bit_compute_dtype=torch.bfloat16)
 # Note: The default behavior now has injection attack prevention off.
 tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)

 from transformers.generation import GenerationConfig
 quantization_config = BitsAndBytesConfig(
             load_in_4bit=True,
+            bnb_4bit_quant_type='int8',
             bnb_4bit_compute_dtype=torch.bfloat16)
 # Note: The default behavior now has injection attack prevention off.
 tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B-Chat", trust_remote_code=True)