Ex0bit
/

lfm-Nanotron

Text Generation

hybrid-architecture

Model card Files Files and versions

Ex0bit commited on Jan 19

Commit

2e7de5c

·

verified ·

1 Parent(s): 9de57ce

Add W2A16 AutoRound quantized: quantization_config.json

Files changed (1) hide show

W2A16-AutoRound/quantization_config.json +13 -0

W2A16-AutoRound/quantization_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "bits": 2,
+  "group_size": 64,
+  "sym": true,
+  "data_type": "int",
+  "lr": 0.002,
+  "minmax_lr": 0.002,
+  "iters": 1000,
+  "nsamples": 1024,
+  "autoround_version": "0.9.5",
+  "quant_method": "auto-round",
+  "packing_format": "auto_round:auto_gptq"
+}