ai-sage
/

Giga-Embeddings-instruct

Feature Extraction

sentence-transformers

Model card Files Files and versions

Сколько RAM требуется для модели?

#8

by morozover - opened May 19, 2025

Хочу запустить модель в качестве эмбеддера

Сколько RAM требуется для модели?

И отдельно, сколько vRAM требуется для модели?

Можно ли получить ответ?

ai-sage org Jun 16, 2025

Не совсем понимаю вопрос про RAM, у вас же модель на GPU?

Я писал:
❝ И отдельно, сколько vRAM требуется для модели?

Это как раз про память GPU

Напоминаю о вопросе
Всё ещё актуально

Можно получить ответ?

ai-sage org Oct 31, 2025

Минимально возможная конфигурация для запуска это 8gb vram/ram, но в таком случае не получится использовать батчи.

Вижу, что суммарный объём файлов .safetensors занимает 14 ГБ
Нужно как-то по особенному поднимать модель, чтобы она заняла 8gb vram/ram?

ai-sage org Oct 31, 2025

Да, модель тренировалась и валидировалась в формате bf16. В карточке модели есть пример запуска

model = AutoModel.from_pretrained(
    'ai-sage/Giga-Embeddings-instruct', 
    attn_implementation="flash_attention_2", 
    torch_dtype=torch.bfloat16,
    trust_remote_code=True
)

Если использовать этот аргумент при загрузке модели torch_dtype=torch.bfloat16, во время инференса она будет занимать 7gb вместо 14

lossful changed discussion status to closed Nov 11, 2025

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment