Qwen3.6-27B-w8a8

1. 基本信息

项目 信息
原始模型名 Qwen3.6-27B
原始模型链接 Qwen3.6-27B
msmodelslim commit id 640291a51ffe5acb919e68f609b84fef419276d4
精度测试机型 Atlas 800T A3 1台
精度测试平台 docker vllm-ascend
版本 vllm-ascend:v0.18.0rc1
链接 quay.io/ascend/vllm-ascend:v0.18.0rc1-a3-openeuler

2 量化脚本:

该模型和Qwen3.5-27B结构一致,msmodelslim已支持一键量化:

msmodelslim quant \
    --model_path weights/Qwen3.6-27B \
    --save_path weights/Qwen3.6-27B-W8A8 \
    --device npu \
    --model_type Qwen3.5-27B \
    --quant_type w8a8 \
    --trust_remote_code True

3 精度测试结果

模型名 量化格式 数据集 测试精度 % 本地浮点精度 %
Qwen3.6-27B-w8a8 w8a8 GPQA 85.415 85.4175

*--max-model-len 256000,精度存在波动,建议多次测试。

Downloads last month
256
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for KingsonHO/Qwen3.6-27B-w8a8

Base model

Qwen/Qwen3.6-27B
Quantized
(392)
this model