Files changed (1) hide show
  1. app.py +8 -3
app.py CHANGED
@@ -16,15 +16,20 @@ YANDEX_FOLDER_ID= os.getenv("YANDEX_FOLDER_ID")
16
  if not all([ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID]):
17
  raise ValueError("Необходимо установить переменные окружения: ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID")
18
 
19
- MAX_NEW_TOKENS = 2048
20
  TEMPERATURE = 1
21
  TOP_P = 0.9
22
  REPETITION_PENALTY = 1.05
23
 
24
  SYS_PROMPT_TT = ("Син-цифрлы ярдәмче (ир-ат нәселе). Сине Сбербанк дирекциясенең ESG да уйлап таптылар. Син барлык өлкәләрдә, бигрәк тә Татарстанга кагылышлы өлкәләрдә кызыклы кулланучы эксперты! Ул сезгә бик күп сораулар бирәчәк, ә сезнең эшегез-шәрехләр бирү, кулланучының сорауларына җавап бирү, адымлап киңәшләр, мисаллар бирү һәм, кирәк булганда, кулланучыга аныклаучы сораулар бирү.")
25
 
26
- print("Загрузка модели с 4-битной квантизацией...")
27
- quantization_config = BitsAndBytesConfig(load_in_4bit=True, bnb_4bit_compute_dtype=torch.bfloat16)
 
 
 
 
 
28
 
29
  tok = AutoTokenizer.from_pretrained(ADAPTER_ID, use_fast=False)
30
  if tok.pad_token is None:
 
16
  if not all([ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID]):
17
  raise ValueError("Необходимо установить переменные окружения: ADAPTER_ID, YANDEX_API_KEY, YANDEX_FOLDER_ID")
18
 
19
+ MAX_NEW_TOKENS = 1024
20
  TEMPERATURE = 1
21
  TOP_P = 0.9
22
  REPETITION_PENALTY = 1.05
23
 
24
  SYS_PROMPT_TT = ("Син-цифрлы ярдәмче (ир-ат нәселе). Сине Сбербанк дирекциясенең ESG да уйлап таптылар. Син барлык өлкәләрдә, бигрәк тә Татарстанга кагылышлы өлкәләрдә кызыклы кулланучы эксперты! Ул сезгә бик күп сораулар бирәчәк, ә сезнең эшегез-шәрехләр бирү, кулланучының сорауларына җавап бирү, адымлап киңәшләр, мисаллар бирү һәм, кирәк булганда, кулланучыга аныклаучы сораулар бирү.")
25
 
26
+ print("Загрузка модели с 8-битной квантизацией...")
27
+ quantization_config = BitsAndBytesConfig(
28
+ load_in_8bit=True,
29
+ llm_int8_threshold=6.0,
30
+ llm_int8_enable_fp32_cpu_offload=False
31
+ )
32
+
33
 
34
  tok = AutoTokenizer.from_pretrained(ADAPTER_ID, use_fast=False)
35
  if tok.pad_token is None: