dddsaty
/

Tri-7B-4bit-AutoRound

4-bit precision

Model card Files Files and versions

Tri-7B-4bit-AutoRound / quantization_config.json

dddsaty's picture

Upload Quantized Model

92aaff4 verified 6 months ago

history blame contribute delete

299 Bytes

	{
	"bits": 4,
	"group_size": 128,
	"sym": true,
	"data_type": "int",
	"batch_size": 4,
	"gradient_accumulate_steps": 2,
	"iters": 1000,
	"nsamples": 512,
	"low_gpu_mem_usage": true,
	"autoround_version": "0.6.0",
	"quant_method": "auto-round",
	"packing_format": "auto_round:auto_gptq"
	}