File size: 225 Bytes
cb2428f |
1 2 3 4 5 6 7 8 9 |
CUDA_VISIBLE_DEVICES=0 swift app \
--model Qwen/Qwen2.5-7B-Instruct \
--stream true \
--infer_backend vllm \
--max_new_tokens 2048 \
--gpu_memory_utilization 0.9 \
--max_model_len 8192 \
--lang zh
|