qwen3.5-fp8 - a Hyper-AI Collection

Hyper-AI 's Collections

qwen3-vl-embedding-fp8

qwen3.5-fp8

updated 3 days ago

fp8 quant for qwen3.5 models, nearly half memory decrease, speedup 30%, vllm serve can run

Hyper-AI/Qwen3.5-9B-fp8

Image-Text-to-Text • 10B • Updated 3 days ago • 323 • 1