jiaxwang
/

test

jiaxwang commited on Dec 29, 2025

Commit

add62b8

verified ·

1 Parent(s): 6d4edc4

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -40,7 +40,7 @@ python3 internal_scripts/quantize_quark.py \
     --attention_dtype fp8 \
     --exclude_layers $exclude_layers \
     --num_calib_data 512 \
-    --output_dir amd/gpt-oss120b-w-mxfp4-a-fp8 \
     --model_export hf_format \
     --multi_gpu
 ```

     --attention_dtype fp8 \
     --exclude_layers $exclude_layers \
     --num_calib_data 512 \
+    --output_dir amd/gpt-oss120b-moe_w-mxfp4-a-fp8-attn_ptpc-kv-soft_fp8 \
     --model_export hf_format \
     --multi_gpu
 ```