Intel
/

Qwen3-8B-int4-AutoRound

4-bit precision

Model card Files Files and versions

n1ck-guo commited on May 26, 2025

Commit

f2dad8d

·

verified ·

1 Parent(s): f24d7a2

Update README.md

Files changed (1) hide show

README.md +0 -1

README.md CHANGED Viewed

@@ -13,7 +13,6 @@ This model is an int4 model with group_size 128 and symmetric quantization of [Q
 ### INT4 Inference(CPU/CUDA/INTEL GPU)
 ```python
-from auto_round import AutoRoundConfig ##must import for auto-round format if transformers <= 4.51.3
 from transformers import AutoModelForCausalLM,AutoTokenizer
 quantized_model_dir = "Intel/Qwen3-8B-int4-AutoRound-inc"

 ### INT4 Inference(CPU/CUDA/INTEL GPU)
 ```python
 from transformers import AutoModelForCausalLM,AutoTokenizer
 quantized_model_dir = "Intel/Qwen3-8B-int4-AutoRound-inc"