amd
/

Qwen3-Coder-Next-MXFP4

8-bit precision

Model card Files Files and versions

linzhao-amd commited on Feb 3

Commit

6daedbb

·

verified ·

1 Parent(s): 586c292

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -13,11 +13,11 @@ license: apache-2.0
 - **Inference Engine:** [vLLM](https://docs.vllm.ai/en/latest/)
 - **Model Optimizer:** [AMD-Quark](https://quark.docs.amd.com/latest/index.html) (V0.11)
   - **moe**
-    - **Weight quantization:** MOE-only, OCP MXFP4, Static
-    - **Activation quantization:** MOE-only, OCP MXFP4, Dynamic
   - **attn:** `linear_attn.out_proj`, `self_attn.o_proj`
-    - **Weight quantization:** MOE-only, OCP MXFP4, Static
-    - **Activation quantization:** MOE-only, OCP MXFP4, Dynamic
 - **Calibration Dataset:** [Pile](https://huggingface.co/datasets/mit-han-lab/pile-val-backup)
 This model was built with Qwen3-Coder-Next model by applying AMD-Quark for MXFP4 quantization.

 - **Inference Engine:** [vLLM](https://docs.vllm.ai/en/latest/)
 - **Model Optimizer:** [AMD-Quark](https://quark.docs.amd.com/latest/index.html) (V0.11)
   - **moe**
+    - **Weight quantization:** OCP MXFP4, Static
+    - **Activation quantization:** OCP MXFP4, Dynamic
   - **attn:** `linear_attn.out_proj`, `self_attn.o_proj`
+    - **Weight quantization:** OCP MXFP4, Static
+    - **Activation quantization:** OCP MXFP4, Dynamic
 - **Calibration Dataset:** [Pile](https://huggingface.co/datasets/mit-han-lab/pile-val-backup)
 This model was built with Qwen3-Coder-Next model by applying AMD-Quark for MXFP4 quantization.