请问量化后加载过程还是很慢是怎么回事???Loading checkpoint shards: 100%|██████████| 7/7 [08:51<00:00, 75.92s/it]
这个模型没有做量化上的优化,你如果在CPU加载肯定很慢
· Sign up or log in to comment