Увеличение батча замедляет вычисление

by FDuCHeS - opened Feb 1, 2025

Feb 1, 2025

•

edited Feb 3, 2025

Здравствуйте, при попытке увеличить количество пассаджей для обработки например на RTX 4090, снижается скорость вычисления. Чем больше батч, тем медленнее в расчете на одну строку.

Например. Подаю лист с 50 строками по 1000 токенов, обработка условно занимает 10 секунд.
Подаю в цикле лист с 1 строкой на 1000 токенов, но 50 раз и это занимает 5 секунд.

Такая проблема только от 1000 токенов

Например если батч из строк на 512 токенов, то увеличение батча приводит к производительности

Это естественные ограничения модели?

lossful

ai-sage org Sep 26, 2025

Проверьте потребление vRAM во время инференса. Есть подозрение, что у вас заканчивается vRAM и модель начинает выгружать данные в оперативную память, что приводит к сильному замедлению инференса.

lossful changed discussion status to closed Nov 11, 2025

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment