qwen3-vl-embedding-fp8 - a Hyper-AI Collection

Hyper-AI 's Collections

qwen3-vl-embedding-fp8

qwen3-vl-embedding-fp8

updated 3 days ago

fp8 quant for qwen3-vl-embedding models, nearly half memory decrease, speedup 30%, vllm serve can run

Hyper-AI/Qwen3-VL-Embedding-8B-fp8

Feature Extraction • 8B • Updated 3 days ago • 67 • 1