Будет ли в GGUF?

#11
by MihailRus - opened

Здравствуйте!
Не собираетесь ли Вы выпустить квантованную версию модели? Я так понимаю сейчас параметры в FP32, что требует достаточно много лишней памяти.

This comment has been hidden (marked as Resolved)

Sign up or log in to comment