8bit_config
#5
by
AccessAndrei
- opened
app.py
CHANGED
|
@@ -16,15 +16,20 @@ YANDEX_FOLDER_ID= os.getenv("YANDEX_FOLDER_ID")
|
|
| 16 |
if not all([ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID]):
|
| 17 |
raise ValueError("Необходимо установить переменные окружения: ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID")
|
| 18 |
|
| 19 |
-
MAX_NEW_TOKENS =
|
| 20 |
TEMPERATURE = 1
|
| 21 |
TOP_P = 0.9
|
| 22 |
REPETITION_PENALTY = 1.05
|
| 23 |
|
| 24 |
SYS_PROMPT_TT = ("Син-цифрлы ярдәмче (ир-ат нәселе). Сине Сбербанк дирекциясенең ESG да уйлап таптылар. Син барлык өлкәләрдә, бигрәк тә Татарстанга кагылышлы өлкәләрдә кызыклы кулланучы эксперты! Ул сезгә бик күп сораулар бирәчәк, ә сезнең эшегез-шәрехләр бирү, кулланучының сорауларына җавап бирү, адымлап киңәшләр, мисаллар бирү һәм, кирәк булганда, кулланучыга аныклаучы сораулар бирү.")
|
| 25 |
|
| 26 |
-
print("Загрузка модели с
|
| 27 |
-
quantization_config = BitsAndBytesConfig(
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 28 |
|
| 29 |
tok = AutoTokenizer.from_pretrained(ADAPTER_ID, use_fast=False)
|
| 30 |
if tok.pad_token is None:
|
|
|
|
| 16 |
if not all([ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID]):
|
| 17 |
raise ValueError("Необходимо установить переменные окружения: ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID")
|
| 18 |
|
| 19 |
+
MAX_NEW_TOKENS = 1024
|
| 20 |
TEMPERATURE = 1
|
| 21 |
TOP_P = 0.9
|
| 22 |
REPETITION_PENALTY = 1.05
|
| 23 |
|
| 24 |
SYS_PROMPT_TT = ("Син-цифрлы ярдәмче (ир-ат нәселе). Сине Сбербанк дирекциясенең ESG да уйлап таптылар. Син барлык өлкәләрдә, бигрәк тә Татарстанга кагылышлы өлкәләрдә кызыклы кулланучы эксперты! Ул сезгә бик күп сораулар бирәчәк, ә сезнең эшегез-шәрехләр бирү, кулланучының сорауларына җавап бирү, адымлап киңәшләр, мисаллар бирү һәм, кирәк булганда, кулланучыга аныклаучы сораулар бирү.")
|
| 25 |
|
| 26 |
+
print("Загрузка модели с 8-битной квантизацией...")
|
| 27 |
+
quantization_config = BitsAndBytesConfig(
|
| 28 |
+
load_in_8bit=True,
|
| 29 |
+
llm_int8_threshold=6.0,
|
| 30 |
+
llm_int8_enable_fp32_cpu_offload=False
|
| 31 |
+
)
|
| 32 |
+
|
| 33 |
|
| 34 |
tok = AutoTokenizer.from_pretrained(ADAPTER_ID, use_fast=False)
|
| 35 |
if tok.pad_token is None:
|