JunHowie
/

Qwen3-8B-GPTQ-Int8

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

JunHowie commited on Sep 4, 2025

Commit

e131f54

·

verified ·

1 Parent(s): a2c03ee

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -21,7 +21,7 @@ Base model: [Qwen/Qwen3-8B](https://huggingface.co/Qwen/Qwen3-8B)
 <i>Compared to earlier quantized versions, the new quantized model demonstrates better tokens/s efficiency. This improvement comes from setting desc_act=False in the quantization configuration.</i>
 ```
-vllm serve JunHowie/Qwen3-8B-GPTQ-Int8
 ```
 ### 【Dependencies】

 <i>Compared to earlier quantized versions, the new quantized model demonstrates better tokens/s efficiency. This improvement comes from setting desc_act=False in the quantization configuration.</i>
 ```
+vllm serve JunHowie/Qwen3-8B-GPTQ-Int8
 ```
 ### 【Dependencies】