RedHatAI
/

Qwen3-Next-80B-A3B-Instruct-FP8-block

I'm getting an error running this with vllm/llm-d ghcr.io/llm-d/llm-d-cuda:v0.4.0

#1 opened 5 months ago by