amd
/

GLM-4.7-MXFP4

@@ -29,7 +29,7 @@ AMD-Quark has been installed from source code inside the Docker image `rocm/vllm
 **Quantization scripts:**
-Step1: Creat the quantize_glm.py
 ```
 import runpy
 from quark.torch import LLMTemplate
@@ -50,7 +50,7 @@ quantize_script = "/app/Quark/examples/torch/language_modeling/llm_ptq/quantize_
 runpy.run_path(quantize_script, run_name="__main__")
 ```
-Step1: Quantize with the quantize_glm.py
 ```
 export CUDA_VISIBLE_DEVICES=0,1,2,3
 export MODEL_DIR=zai-org/GLM-4.7

 **Quantization scripts:**
+- **Step1:** Creat the quantize_glm.py
 ```
 import runpy
 from quark.torch import LLMTemplate
 runpy.run_path(quantize_script, run_name="__main__")
 ```
+- **Step2:** Quantize with the quantize_glm.py
 ```
 export CUDA_VISIBLE_DEVICES=0,1,2,3
 export MODEL_DIR=zai-org/GLM-4.7