inference-optimization
/

Qwen3-0.6B-debug-multiply-W4A16-G128

compressed-tensors

Model card Files Files and versions

Qwen3-0.6B-debug-multiply-W4A16-G128 / recipe.yaml

kylesayrs's picture

Copy from nm-testing/Qwen3-0.6B-debug-multiply-W4A16-G128

3eca842 verified 3 months ago

history blame contribute delete

130 Bytes

	default_stage:
	default_modifiers:
	QuantizationModifier:
	targets: [Linear]
	ignore: [lm_head]
	scheme: W4A16