inference-optimization
/

Qwen3-4B-Instruct-2507.w8a8

8-bit precision

compressed-tensors

Model card Files Files and versions

Qwen3-4B-Instruct-2507.w8a8

5.21 GB

1 contributor

History: 2 commits

ChibuUkachi's picture

Upload folder using huggingface_hub

4a783ab verified 10 days ago