reyvan
/

Qwen-7B-8bit

Text Generation

4-bit precision

Model card Files Files and versions

reyvan commited on Feb 22, 2024

Commit

30e7196

·

verified ·

1 Parent(s): 94165f4

Upload quantize_config.json

Files changed (1) hide show

quantize_config.json +3 -3

quantize_config.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-  "bits": 4,
   "group_size": 128,
   "damp_percent": 0.01,
   "desc_act": false,
   "static_groups": false,
   "sym": true,
   "true_sequential": true,
-  "model_name_or_path": "Qwen-7B-125m-4bit-128g",
-  "model_file_base_name": "gptq_model-4bit-128g",
   "is_marlin_format": false,
   "quant_method": "gptq"
 }

 {
+  "bits": 8,
   "group_size": 128,
   "damp_percent": 0.01,
   "desc_act": false,
   "static_groups": false,
   "sym": true,
   "true_sequential": true,
+  "model_name_or_path": "Qwen-7B-8bit",
+  "model_file_base_name": "gptq_model-8bit-128g",
   "is_marlin_format": false,
   "quant_method": "gptq"
 }