Здравствуйте!Не собираетесь ли Вы выпустить квантованную версию модели? Я так понимаю сейчас параметры в FP32, что требует достаточно много лишней памяти.
· Sign up or log in to comment