Label Weights: tensor([3.2524, 3.8706, 4.2848, 3.8079, 3.6225, 4.6619, 4.4253, 3.9345, 5.2005, 4.5028, 4.0189, 4.9842, 5.9577, 4.9098, 5.2744, 3.7283, 7.3329, 4.3637, 3.9862, 6.5748, 4.2755, 6.9664, 4.6404, 6.6445, 5.3650, 4.4575, 4.6877, 1.7193]) Epoch 1 | Step 0 | TRAIN Loss: 0.7576 7%|████████████████▏ | 99/1357 [00:44<02:03, 10.18it/s]Step 100 | Avg Logits: -0.1289 11%|████████████████████████▎ | 149/1357 [00:49<01:59, 10.11it/s]Epoch 1 | Step 150 | TRAIN Loss: 0.6624 15%|████████████████████████████████▌ | 200/1357 [00:54<01:59, 9.67it/s]Step 200 | Avg Logits: -0.5848 22%|████████████████████████████████████████████████▊ | 300/1357 [01:05<01:42, 10.29it/s]Step 300 | Avg Logits: -1.7436 Epoch 1 | Step 300 | TRAIN Loss: 0.3553 29%|█████████████████████████████████████████████████████████████████▏ | 400/1357 [01:16<01:45, 9.05it/s]Step 400 | Avg Logits: -2.5360 33%|█████████████████████████████████████████████████████████████████████████▎ | 450/1357 [01:21<01:34, 9.64it/s]Epoch 1 | Step 450 | TRAIN Loss: 0.3651 37%|█████████████████████████████████████████████████████████████████████████████████▎ | 499/1357 [01:26<01:31, 9.37it/s]Unfreezing encoder weights Step 500 | Avg Logits: -2.1546 44%|█████████████████████████████████████████████████████████████████████████████████████████████████▋ | 600/1357 [01:53<03:54, 3.23it/s]Step 600 | Avg Logits: -2.2382 Epoch 1 | Step 600 | TRAIN Loss: 0.3282 52%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████ | 700/1357 [02:20<02:42, 4.05it/s]Step 700 | Avg Logits: -2.3596 55%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 750/1357 [02:35<02:47, 3.63it/s]Epoch 1 | Step 750 | TRAIN Loss: 0.3615 59%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 800/1357 [02:49<02:48, 3.31it/s]Step 800 | Avg Logits: -2.4556 66%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌ | 900/1357 [03:17<02:18, 3.31it/s]Step 900 | Avg Logits: -2.4075 Epoch 1 | Step 900 | TRAIN Loss: 0.3065 74%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████ | 1000/1357 [03:46<01:43, 3.45it/s]Step 1000 | Avg Logits: -2.4079 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 1050/1357 [03:59<01:23, 3.66it/s]Epoch 1 | Step 1050 | TRAIN Loss: 0.3560 81%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎ | 1100/1357 [04:13<01:08, 3.77it/s]Step 1100 | Avg Logits: -2.6674 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌ | 1200/1357 [04:41<00:41, 3.78it/s]Step 1200 | Avg Logits: -2.6561 Epoch 1 | Step 1200 | TRAIN Loss: 0.3694 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ | 1300/1357 [05:08<00:16, 3.53it/s]Step 1300 | Avg Logits: -2.7167 99%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊ | 1350/1357 [05:22<00:01, 3.54it/s]Epoch 1 | Step 1350 | TRAIN Loss: 0.3163 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1357/1357 [05:25<00:00, 4.17it/s] {'f1_macro': 0.19094998452785217, 'f1_micro': 0.4076115952338609, 'roc_auc': 0.7783624901227515} FINISH EPOCH 1 | TRAIN Loss: 0.2883 | Eval Loss: 0.3145 0%| | 0/1357 [00:00