nvidia
/

Qwen3-8B-DMS-8x

Triton kernel optimizations for DMS prefill path (up to 1.65x speedup)

#1 opened about 1 month ago by