hf_quant_config.json · Geodd/GLM-4.7-Flash-W8A16 at main

GLM-4.7-Flash-W8A16 / hf_quant_config.json

Geodd's picture

Upload folder using huggingface_hub

1721dc7 verified 12 days ago

history blame contribute delete

241 Bytes

	{
	"producer": {
	"name": "modelopt",
	"version": "0.37.0"
	},
	"quantization": {
	"quant_algo": "W8A16",
	"kv_cache_quant_algo": null,
	"exclude_modules": [
	"lm_head"
	]
	}
	}