kh4dien
/

gemma4-e2b-it-w8a16

compressed-tensors

Model card Files Files and versions

gemma4-e2b-it-w8a16 / quantization_manifest.json

kh4dien's picture

Upload Gemma 4 GPTQ W4A16 baseline

ff96335 verified about 1 month ago

history blame contribute delete

1.22 kB

	{
	"base_model_id": "google/gemma-4-E2B-it",
	"base_revision": "b4a601102c3d45e2b7b50e2057a6d5ec8ed4adcf",
	"calibration_dataset": "mit-han-lab/pile-val-backup",
	"calibration_mode": "gemma4_processor",
	"calibration_revision": null,
	"calibration_samples": 512,
	"calibration_split": "validation",
	"created_at_utc": "2026-04-13T01:27:27.503605+00:00",
	"dataset_preparation": {
	"input_format": "text",
	"num_rows_loaded": 512,
	"pretokenized": true
	},
	"group_size": 128,
	"ignore_patterns": [
	"lm_head",
	"re:.embed.",
	"re:.*router",
	"re:.vision_tower.",
	"re:.audio.",
	"re:.multi_modal_projector.",
	"re:.projector."
	],
	"loader": "Gemma4ForConditionalGeneration",
	"max_seq_len": 2048,
	"model_type": "gemma4",
	"package_versions": {
	"datasets": "4.8.4",
	"huggingface_hub": "1.11.0.dev0",
	"llmcompressor": "0.10.1.dev88+g3c9d4fd7",
	"torch": "2.6.0+cu124",
	"transformers": "5.6.0.dev0"
	},
	"precision": "auto",
	"quantization_scheme": "W8A16",
	"recipe_name": "quant-w8a16",
	"seed": 42,
	"target_modules": [
	"Linear"
	],
	"upload_repo": null,
	"weight_bits": 8,
	"weight_strategy": "group",
	"weight_symmetric": true
	}