Ex0bit
/

lfm-Nanotron

Text Generation

hybrid-architecture

Model card Files Files and versions

Ex0bit commited on Jan 19

Commit

ae5cb46

·

verified ·

1 Parent(s): 3f134a3

Add W4A16 AutoRound: quantization_config.json

Files changed (1) hide show

W4A16-AutoRound/quantization_config.json +11 -0

W4A16-AutoRound/quantization_config.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "bits": 4,
+  "group_size": 128,
+  "sym": true,
+  "data_type": "int",
+  "iters": 500,
+  "nsamples": 512,
+  "autoround_version": "0.9.5",
+  "quant_method": "auto-round",
+  "packing_format": "auto_round:auto_gptq"
+}