======================================================================== Post-Training Evaluation — Turkic LoRA ======================================================================== [INFO] Loading base model: google/gemma-2-9b [INFO] Loading adapter from: ./output_ky_bf16_r16_lr2e4_3ep/final_adapter [transformers] `torch_dtype` is deprecated! Use `dtype` instead! Loading weights: 0%| | 0/464 [00:00= 0) instead. torch._check_is_size(blocksize) Loading weights: 1%|▊ | 4/464 [00:00<00:58, 7.91it/s] Loading weights: 3%|██▉ | 14/464 [00:00<00:15, 28.40it/s] Loading weights: 5%|████▋ | 22/464 [00:00<00:10, 40.56it/s] Loading weights: 6%|█████▉ | 28/464 [00:00<00:10, 41.99it/s] Loading weights: 8%|████████ | 38/464 [00:01<00:08, 50.22it/s] Loading weights: 10%|██████████▏ | 48/464 [00:01<00:06, 60.63it/s] Loading weights: 13%|████████████▌ | 59/464 [00:01<00:05, 68.55it/s] Loading weights: 15%|██████████████▉ | 70/464 [00:01<00:05, 74.20it/s] Loading weights: 17%|█████████████████ | 80/464 [00:01<00:05, 72.65it/s] Loading weights: 20%|███████████████████▍ | 91/464 [00:01<00:04, 77.35it/s] Loading weights: 21%|█████████████████████ | 99/464 [00:01<00:04, 75.34it/s] Loading weights: 23%|██████████████████████▌ | 107/464 [00:01<00:04, 72.84it/s] Loading weights: 25%|████████████████████████▎ | 115/464 [00:02<00:05, 67.17it/s] Loading weights: 27%|██████████████████████████▍ | 125/464 [00:02<00:04, 72.08it/s] Loading weights: 29%|████████████████████████████▋ | 136/464 [00:02<00:04, 76.84it/s] Loading weights: 31%|██████████████████████████████▊ | 146/464 [00:02<00:04, 73.17it/s] Loading weights: 34%|█████████████████████████████████▏ | 157/464 [00:02<00:03, 77.61it/s] Loading weights: 36%|██████████████████████████████████▊ | 165/464 [00:02<00:03, 78.05it/s] Loading weights: 37%|████████████████████████████████████▌ | 173/464 [00:02<00:03, 73.29it/s] Loading weights: 39%|██████████████████████████████████████▏ | 181/464 [00:03<00:04, 65.58it/s] Loading weights: 41%|████████████████████████████████████████▎ | 191/464 [00:03<00:03, 71.97it/s] Loading weights: 43%|██████████████████████████████████████████▍ | 201/464 [00:03<00:03, 78.37it/s] Loading weights: 45%|████████████████████████████████████████████▎ | 210/464 [00:03<00:03, 79.61it/s] Loading weights: 47%|██████████████████████████████████████████████▎ | 219/464 [00:03<00:03, 73.91it/s] Loading weights: 49%|███████████████████████████████████████████████▉ | 227/464 [00:03<00:03, 66.76it/s] Loading weights: 51%|█████████████████████████████████████████████████▊ | 236/464 [00:03<00:03, 70.23it/s] Loading weights: 53%|███████████████████████████████████████████████████▉ | 246/464 [00:03<00:02, 76.71it/s] Loading weights: 55%|██████████████████████████████████████████████████████▎ | 257/464 [00:04<00:02, 74.72it/s] Loading weights: 58%|████████████████████████████████████████████████████████▌ | 268/464 [00:04<00:02, 80.12it/s] Loading weights: 60%|██████████████████████████████████████████████████████████▉ | 279/464 [00:04<00:02, 82.81it/s] Loading weights: 62%|█████████████████████████████████████████████████████████████▎ | 290/464 [00:04<00:01, 87.59it/s] Loading weights: 65%|███████████████████████████████████████████████████████████████▎ | 300/464 [00:04<00:02, 79.91it/s] Loading weights: 67%|█████████████████████████████████████████████████████████████████▋ | 311/464 [00:04<00:01, 82.72it/s] Loading weights: 69%|███████████████████████████████████████████████████████████████████▌ | 320/464 [00:04<00:01, 82.70it/s] Loading weights: 71%|█████████████████████████████████████████████████████████████████████▍ | 329/464 [00:04<00:01, 77.08it/s] Loading weights: 73%|███████████████████████████████████████████████████████████████████████▏ | 337/464 [00:05<00:01, 67.87it/s] Loading weights: 75%|█████████████████████████████████████████████████████████████████████████ | 346/464 [00:05<00:01, 71.66it/s] Loading weights: 77%|███████████████████████████████████████████████████████████████████████████▍ | 357/464 [00:05<00:01, 75.78it/s] Loading weights: 79%|█████████████████████████████████████████████████████████████████████████████▌ | 367/464 [00:05<00:01, 73.92it/s] Loading weights: 81%|███████████████████████████████████████████████████████████████████████████████▋ | 377/464 [00:05<00:01, 79.92it/s] Loading weights: 83%|█████████████████████████████████████████████████████████████████████████████████▌ | 386/464 [00:05<00:00, 80.21it/s] Loading weights: 85%|███████████████████████████████████████████████████████████████████████████████████▍ | 395/464 [00:05<00:00, 78.71it/s] Loading weights: 87%|█████████████████████████████████████████████████████████████████████████████████████ | 403/464 [00:05<00:00, 74.65it/s] Loading weights: 89%|███████████████████████████████████████████████████████████████████████████████████████ | 412/464 [00:06<00:00, 70.21it/s] Loading weights: 91%|█████████████████████████████████████████████████████████████████████████████████████████▏ | 422/464 [00:06<00:00, 77.12it/s] Loading weights: 93%|███████████████████████████████████████████████████████████████████████████████████████████▏ | 432/464 [00:06<00:00, 82.76it/s] Loading weights: 95%|█████████████████████████████████████████████████████████████████████████████████████████████▏ | 441/464 [00:06<00:00, 83.47it/s] Loading weights: 97%|███████████████████████████████████████████████████████████████████████████████████████████████ | 450/464 [00:06<00:00, 76.74it/s] Loading weights: 99%|████████████████████████████████████████████████████████████████████████████████████████████████▋ | 458/464 [00:06<00:00, 64.60it/s] Loading weights: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████| 464/464 [00:06<00:00, 69.47it/s] [INFO] Parameters: 5,133,925,888 total, 0 trainable (0.00%) ──────────────────────────────────────────────────────────── PERPLEXITY EVALUATION ──────────────────────────────────────────────────────────── Generating train split: 0 examples [00:00, ? examples/s] Generating train split: 1626 examples [00:00, 12650.22 examples/s] Generating train split: 3837 examples [00:00, 17454.85 examples/s] Generating train split: 6513 examples [00:00, 19332.65 examples/s] Generating train split: 9104 examples [00:00, 19837.70 examples/s] Generating train split: 12367 examples [00:00, 23008.83 examples/s] Generating train split: 20270 examples [00:00, 32282.48 examples/s] Generating train split: 28798 examples [00:00, 37387.21 examples/s] Generating train split: 33588 examples [00:01, 39010.99 examples/s] Generating train split: 44566 examples [00:01, 47870.34 examples/s] Generating train split: 57845 examples [00:01, 57449.85 examples/s] Generating train split: 61879 examples [00:01, 40853.87 examples/s] Generating train split: 0 examples [00:00, ? examples/s] Generating train split: 1150 examples [00:00, 9981.38 examples/s] Generating train split: 2295 examples [00:00, 9220.59 examples/s] Generating train split: 4576 examples [00:00, 11206.99 examples/s] Generating train split: 5707 examples [00:00, 11070.60 examples/s] Generating train split: 6848 examples [00:00, 10666.74 examples/s] Generating train split: 7985 examples [00:00, 10127.30 examples/s] Generating train split: 10269 examples [00:00, 10519.59 examples/s] Generating train split: 11415 examples [00:01, 10046.33 examples/s] Generating train split: 13709 examples [00:01, 10471.00 examples/s] Generating train split: 15803 examples [00:01, 12140.60 examples/s] Generating train split: 18451 examples [00:01, 14576.53 examples/s] Generating train split: 21242 examples [00:01, 16573.13 examples/s] Generating train split: 21242 examples [00:01, 12582.24 examples/s] Tokenizing (num_proc=30): 0%| | 0/100481 [00:00= 0) instead. torch._check_is_size(blocksize) [ky] P=0.109 R=0.333 F1=0.164 (parse_fail=0/100) [kz] Loading WikiANN (kk)... Generating validation split: 0%| | 0/1000 [00:00