CUDA_VISIBLE_DEVICES=0 \ swift infer \ --adapters /root/autodl-tmp/output_7B_SFT/v0-20250605-155458/checkpoint-1095 \ --stream true \ --temperature 0 \ --max_new_tokens 2048