Add MTP layers to quantization_config.ignore list

Files changed (1) hide show

config.json CHANGED Viewed

@@ -320,7 +320,15 @@
       "model.language_model.layers.62.linear_attn.in_proj_b",
       "model.language_model.layers.62.linear_attn.in_proj_a",
       "model.language_model.layers.63.self_attn.o_proj",
-      "lm_head"
     ],
     "kv_cache_scheme": null,
     "quant_method": "compressed-tensors",
@@ -464,4 +472,4 @@
   },
   "vision_end_token_id": 248054,
   "vision_start_token_id": 248053
-}

       "model.language_model.layers.62.linear_attn.in_proj_b",
       "model.language_model.layers.62.linear_attn.in_proj_a",
       "model.language_model.layers.63.self_attn.o_proj",
+      "lm_head",
+      "mtp.fc",
+      "mtp.layers.0.self_attn.q_proj",
+      "mtp.layers.0.self_attn.k_proj",
+      "mtp.layers.0.self_attn.v_proj",
+      "mtp.layers.0.self_attn.o_proj",
+      "mtp.layers.0.mlp.gate_proj",
+      "mtp.layers.0.mlp.up_proj",
+      "mtp.layers.0.mlp.down_proj"
     ],
     "kv_cache_scheme": null,
     "quant_method": "compressed-tensors",
   },
   "vision_end_token_id": 248054,
   "vision_start_token_id": 248053
+}