Initial upload of AWQ quantized Qwen3-VL-8B-Instruct

df4a298 verified 6 months ago

696 Bytes

	default_stage:
	default_modifiers:
	AWQModifier:
	targets: [Linear]
	ignore: ['re:model\.visual.', 're:visual.', lm_head, model.vision_tower, vision_tower,
	model.vision_model, vision_model, visual, vision_proj, model.visual]
	scheme: W4A16
	mappings:
	- smooth_layer: re:.*input_layernorm$
	balance_layers: ['re:.q_proj$', 're:.k_proj$', 're:.*v_proj$']
	- smooth_layer: re:.*v_proj$
	balance_layers: ['re:.*o_proj$']
	- smooth_layer: re:.*post_attention_layernorm$
	balance_layers: ['re:.gate_proj$', 're:.up_proj$']
	- smooth_layer: re:.*up_proj$
	balance_layers: ['re:.*down_proj$']
	duo_scaling: true