我使用pip install -U更新vllm docker中的Transformer后成功启动了GLM-5,但是在8*H100环境下,平均只有5 Token/s,完全不可用,有人遇到过这种情况吗?
· Sign up or log in to comment