CV-INSIDE/vit-base-kidney-stone

Browse files

Files changed (7) hide show

README.md +12 -12
all_results.json +12 -12
model.safetensors +1 -1
test_results.json +8 -8
train_results.json +4 -4
trainer_state.json +89 -89
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -25,16 +25,16 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.8616666666666667
     - name: Precision
       type: precision
-      value: 0.8822395663345405
     - name: Recall
       type: recall
-      value: 0.8616666666666667
     - name: F1
       type: f1
-      value: 0.862283860702826
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -44,11 +44,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4868
-- Accuracy: 0.8617
-- Precision: 0.8822
-- Recall: 0.8617
-- F1: 0.8623
 ## Model description
@@ -80,9 +80,9 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| 0.207         | 0.33  | 100  | 0.5822          | 0.8237   | 0.8413    | 0.8237 | 0.8268 |
-| 0.1275        | 0.67  | 200  | 0.5722          | 0.8267   | 0.8338    | 0.8267 | 0.8287 |
-| 0.0313        | 1.0   | 300  | 0.4868          | 0.8617   | 0.8822    | 0.8617 | 0.8623 |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.8133333333333334
     - name: Precision
       type: precision
+      value: 0.8451020337181513
     - name: Recall
       type: recall
+      value: 0.8133333333333334
     - name: F1
       type: f1
+      value: 0.8083110647337813
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6356
+- Accuracy: 0.8133
+- Precision: 0.8451
+- Recall: 0.8133
+- F1: 0.8083
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| 0.2529        | 0.33  | 100  | 0.6368          | 0.7996   | 0.8486    | 0.7996 | 0.8000 |
+| 0.071         | 0.67  | 200  | 0.6456          | 0.8142   | 0.8425    | 0.8142 | 0.8020 |
+| 0.032         | 1.0   | 300  | 0.6356          | 0.8133   | 0.8451    | 0.8133 | 0.8083 |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
     "epoch": 1.0,
-    "eval_accuracy": 0.8616666666666667,
-    "eval_f1": 0.862283860702826,
-    "eval_loss": 0.4867922067642212,
-    "eval_precision": 0.8822395663345405,
-    "eval_recall": 0.8616666666666667,
-    "eval_runtime": 42.1824,
-    "eval_samples_per_second": 56.896,
-    "eval_steps_per_second": 7.112,
-    "train_loss": 0.2792618449529012,
-    "train_runtime": 263.2327,
-    "train_samples_per_second": 36.47,
-    "train_steps_per_second": 1.14
 }

 {
     "epoch": 1.0,
+    "eval_accuracy": 0.8133333333333334,
+    "eval_f1": 0.8083110647337813,
+    "eval_loss": 0.6355786919593811,
+    "eval_precision": 0.8451020337181513,
+    "eval_recall": 0.8133333333333334,
+    "eval_runtime": 40.1918,
+    "eval_samples_per_second": 59.714,
+    "eval_steps_per_second": 7.464,
+    "train_loss": 0.28289230664571124,
+    "train_runtime": 269.4002,
+    "train_samples_per_second": 35.635,
+    "train_steps_per_second": 1.114
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4db40a86ba1fd0e32267b43f9124056d79ff2f5f33d83255f91fdb563f0056aa
 size 343236280

 version https://git-lfs.github.com/spec/v1
+oid sha256:54d11a3e8c067da4f1638c9a56b9efb7f7cecc0a3c9197fbc53d903b5daaf601
 size 343236280

test_results.json CHANGED Viewed

@@ -1,11 +1,11 @@
 {
     "epoch": 1.0,
-    "eval_accuracy": 0.8616666666666667,
-    "eval_f1": 0.862283860702826,
-    "eval_loss": 0.4867922067642212,
-    "eval_precision": 0.8822395663345405,
-    "eval_recall": 0.8616666666666667,
-    "eval_runtime": 42.1824,
-    "eval_samples_per_second": 56.896,
-    "eval_steps_per_second": 7.112
 }

 {
     "epoch": 1.0,
+    "eval_accuracy": 0.8133333333333334,
+    "eval_f1": 0.8083110647337813,
+    "eval_loss": 0.6355786919593811,
+    "eval_precision": 0.8451020337181513,
+    "eval_recall": 0.8133333333333334,
+    "eval_runtime": 40.1918,
+    "eval_samples_per_second": 59.714,
+    "eval_steps_per_second": 7.464
 }

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.2792618449529012,
-    "train_runtime": 263.2327,
-    "train_samples_per_second": 36.47,
-    "train_steps_per_second": 1.14
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.28289230664571124,
+    "train_runtime": 269.4002,
+    "train_samples_per_second": 35.635,
+    "train_steps_per_second": 1.114
 }

trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.4867922067642212,
   "best_model_checkpoint": "./vit-base-kidney-stone\\checkpoint-300",
   "epoch": 1.0,
   "eval_steps": 100,
@@ -11,407 +11,407 @@
     {
       "epoch": 0.02,
       "learning_rate": 0.00019666666666666666,
-      "loss": 1.7127,
       "step": 5
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.00019333333333333333,
-      "loss": 1.4819,
       "step": 10
     },
     {
       "epoch": 0.05,
       "learning_rate": 0.00019,
-      "loss": 1.196,
       "step": 15
     },
     {
       "epoch": 0.07,
       "learning_rate": 0.0001866666666666667,
-      "loss": 0.9416,
       "step": 20
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.00018333333333333334,
-      "loss": 0.7936,
       "step": 25
     },
     {
       "epoch": 0.1,
       "learning_rate": 0.00018,
-      "loss": 0.7043,
       "step": 30
     },
     {
       "epoch": 0.12,
       "learning_rate": 0.00017666666666666666,
-      "loss": 0.8164,
       "step": 35
     },
     {
       "epoch": 0.13,
       "learning_rate": 0.00017333333333333334,
-      "loss": 0.6153,
       "step": 40
     },
     {
       "epoch": 0.15,
       "learning_rate": 0.00017,
-      "loss": 0.5327,
       "step": 45
     },
     {
       "epoch": 0.17,
       "learning_rate": 0.0001666666666666667,
-      "loss": 0.5316,
       "step": 50
     },
     {
       "epoch": 0.18,
       "learning_rate": 0.00016333333333333334,
-      "loss": 0.442,
       "step": 55
     },
     {
       "epoch": 0.2,
       "learning_rate": 0.00016,
-      "loss": 0.4206,
       "step": 60
     },
     {
       "epoch": 0.22,
       "learning_rate": 0.00015666666666666666,
-      "loss": 0.3947,
       "step": 65
     },
     {
       "epoch": 0.23,
       "learning_rate": 0.00015333333333333334,
-      "loss": 0.3422,
       "step": 70
     },
     {
       "epoch": 0.25,
       "learning_rate": 0.00015000000000000001,
-      "loss": 0.3973,
       "step": 75
     },
     {
       "epoch": 0.27,
       "learning_rate": 0.00014666666666666666,
-      "loss": 0.302,
       "step": 80
     },
     {
       "epoch": 0.28,
       "learning_rate": 0.00014333333333333334,
-      "loss": 0.2885,
       "step": 85
     },
     {
       "epoch": 0.3,
       "learning_rate": 0.00014,
-      "loss": 0.1784,
       "step": 90
     },
     {
       "epoch": 0.32,
       "learning_rate": 0.00013666666666666666,
-      "loss": 0.2273,
       "step": 95
     },
     {
       "epoch": 0.33,
       "learning_rate": 0.00013333333333333334,
-      "loss": 0.207,
       "step": 100
     },
     {
       "epoch": 0.33,
-      "eval_accuracy": 0.82375,
-      "eval_f1": 0.8267992833893669,
-      "eval_loss": 0.582241415977478,
-      "eval_precision": 0.8413405833504677,
-      "eval_recall": 0.82375,
-      "eval_runtime": 40.0025,
-      "eval_samples_per_second": 59.996,
-      "eval_steps_per_second": 7.5,
       "step": 100
     },
     {
       "epoch": 0.35,
       "learning_rate": 0.00013000000000000002,
-      "loss": 0.1732,
       "step": 105
     },
     {
       "epoch": 0.37,
       "learning_rate": 0.00012666666666666666,
-      "loss": 0.2279,
       "step": 110
     },
     {
       "epoch": 0.38,
       "learning_rate": 0.00012333333333333334,
-      "loss": 0.1756,
       "step": 115
     },
     {
       "epoch": 0.4,
       "learning_rate": 0.00012,
-      "loss": 0.143,
       "step": 120
     },
     {
       "epoch": 0.42,
       "learning_rate": 0.00011666666666666668,
-      "loss": 0.2222,
       "step": 125
     },
     {
       "epoch": 0.43,
       "learning_rate": 0.00011333333333333334,
-      "loss": 0.1897,
       "step": 130
     },
     {
       "epoch": 0.45,
       "learning_rate": 0.00011000000000000002,
-      "loss": 0.2283,
       "step": 135
     },
     {
       "epoch": 0.47,
       "learning_rate": 0.00010666666666666667,
-      "loss": 0.1815,
       "step": 140
     },
     {
       "epoch": 0.48,
       "learning_rate": 0.00010333333333333334,
-      "loss": 0.174,
       "step": 145
     },
     {
       "epoch": 0.5,
       "learning_rate": 0.0001,
-      "loss": 0.1429,
       "step": 150
     },
     {
       "epoch": 0.52,
       "learning_rate": 9.666666666666667e-05,
-      "loss": 0.0953,
       "step": 155
     },
     {
       "epoch": 0.53,
       "learning_rate": 9.333333333333334e-05,
-      "loss": 0.1442,
       "step": 160
     },
     {
       "epoch": 0.55,
       "learning_rate": 9e-05,
-      "loss": 0.1944,
       "step": 165
     },
     {
       "epoch": 0.57,
       "learning_rate": 8.666666666666667e-05,
-      "loss": 0.1636,
       "step": 170
     },
     {
       "epoch": 0.58,
       "learning_rate": 8.333333333333334e-05,
-      "loss": 0.1008,
       "step": 175
     },
     {
       "epoch": 0.6,
       "learning_rate": 8e-05,
-      "loss": 0.1728,
       "step": 180
     },
     {
       "epoch": 0.62,
       "learning_rate": 7.666666666666667e-05,
-      "loss": 0.0754,
       "step": 185
     },
     {
       "epoch": 0.63,
       "learning_rate": 7.333333333333333e-05,
-      "loss": 0.0634,
       "step": 190
     },
     {
       "epoch": 0.65,
       "learning_rate": 7e-05,
-      "loss": 0.0519,
       "step": 195
     },
     {
       "epoch": 0.67,
       "learning_rate": 6.666666666666667e-05,
-      "loss": 0.1275,
       "step": 200
     },
     {
       "epoch": 0.67,
-      "eval_accuracy": 0.8266666666666667,
-      "eval_f1": 0.8287125800085143,
-      "eval_loss": 0.572192907333374,
-      "eval_precision": 0.8337568888460007,
-      "eval_recall": 0.8266666666666667,
-      "eval_runtime": 40.0669,
-      "eval_samples_per_second": 59.9,
-      "eval_steps_per_second": 7.487,
       "step": 200
     },
     {
       "epoch": 0.68,
       "learning_rate": 6.333333333333333e-05,
-      "loss": 0.0879,
       "step": 205
     },
     {
       "epoch": 0.7,
       "learning_rate": 6e-05,
-      "loss": 0.0707,
       "step": 210
     },
     {
       "epoch": 0.72,
       "learning_rate": 5.666666666666667e-05,
-      "loss": 0.0993,
       "step": 215
     },
     {
       "epoch": 0.73,
       "learning_rate": 5.333333333333333e-05,
-      "loss": 0.0539,
       "step": 220
     },
     {
       "epoch": 0.75,
       "learning_rate": 5e-05,
-      "loss": 0.0641,
       "step": 225
     },
     {
       "epoch": 0.77,
       "learning_rate": 4.666666666666667e-05,
-      "loss": 0.0443,
       "step": 230
     },
     {
       "epoch": 0.78,
       "learning_rate": 4.3333333333333334e-05,
-      "loss": 0.0532,
       "step": 235
     },
     {
       "epoch": 0.8,
       "learning_rate": 4e-05,
-      "loss": 0.0562,
       "step": 240
     },
     {
       "epoch": 0.82,
       "learning_rate": 3.6666666666666666e-05,
-      "loss": 0.0919,
       "step": 245
     },
     {
       "epoch": 0.83,
       "learning_rate": 3.3333333333333335e-05,
-      "loss": 0.0582,
       "step": 250
     },
     {
       "epoch": 0.85,
       "learning_rate": 3e-05,
-      "loss": 0.0633,
       "step": 255
     },
     {
       "epoch": 0.87,
       "learning_rate": 2.6666666666666667e-05,
-      "loss": 0.0591,
       "step": 260
     },
     {
       "epoch": 0.88,
       "learning_rate": 2.3333333333333336e-05,
-      "loss": 0.039,
       "step": 265
     },
     {
       "epoch": 0.9,
       "learning_rate": 2e-05,
-      "loss": 0.0323,
       "step": 270
     },
     {
       "epoch": 0.92,
       "learning_rate": 1.6666666666666667e-05,
-      "loss": 0.0513,
       "step": 275
     },
     {
       "epoch": 0.93,
       "learning_rate": 1.3333333333333333e-05,
-      "loss": 0.0829,
       "step": 280
     },
     {
       "epoch": 0.95,
       "learning_rate": 1e-05,
-      "loss": 0.0354,
       "step": 285
     },
     {
       "epoch": 0.97,
       "learning_rate": 6.666666666666667e-06,
-      "loss": 0.0667,
       "step": 290
     },
     {
       "epoch": 0.98,
       "learning_rate": 3.3333333333333333e-06,
-      "loss": 0.0408,
       "step": 295
     },
     {
       "epoch": 1.0,
       "learning_rate": 0.0,
-      "loss": 0.0313,
       "step": 300
     },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.8616666666666667,
-      "eval_f1": 0.862283860702826,
-      "eval_loss": 0.4867922067642212,
-      "eval_precision": 0.8822395663345405,
-      "eval_recall": 0.8616666666666667,
-      "eval_runtime": 40.1988,
-      "eval_samples_per_second": 59.703,
-      "eval_steps_per_second": 7.463,
       "step": 300
     },
     {
       "epoch": 1.0,
       "step": 300,
       "total_flos": 7.43949770489856e+17,
-      "train_loss": 0.2792618449529012,
-      "train_runtime": 263.2327,
-      "train_samples_per_second": 36.47,
-      "train_steps_per_second": 1.14
     }
   ],
   "logging_steps": 5,

 {
+  "best_metric": 0.6355786919593811,
   "best_model_checkpoint": "./vit-base-kidney-stone\\checkpoint-300",
   "epoch": 1.0,
   "eval_steps": 100,
     {
       "epoch": 0.02,
       "learning_rate": 0.00019666666666666666,
+      "loss": 1.7,
       "step": 5
     },
     {
       "epoch": 0.03,
       "learning_rate": 0.00019333333333333333,
+      "loss": 1.4482,
       "step": 10
     },
     {
       "epoch": 0.05,
       "learning_rate": 0.00019,
+      "loss": 1.2193,
       "step": 15
     },
     {
       "epoch": 0.07,
       "learning_rate": 0.0001866666666666667,
+      "loss": 0.9874,
       "step": 20
     },
     {
       "epoch": 0.08,
       "learning_rate": 0.00018333333333333334,
+      "loss": 0.8483,
       "step": 25
     },
     {
       "epoch": 0.1,
       "learning_rate": 0.00018,
+      "loss": 0.6737,
       "step": 30
     },
     {
       "epoch": 0.12,
       "learning_rate": 0.00017666666666666666,
+      "loss": 0.625,
       "step": 35
     },
     {
       "epoch": 0.13,
       "learning_rate": 0.00017333333333333334,
+      "loss": 0.643,
       "step": 40
     },
     {
       "epoch": 0.15,
       "learning_rate": 0.00017,
+      "loss": 0.5202,
       "step": 45
     },
     {
       "epoch": 0.17,
       "learning_rate": 0.0001666666666666667,
+      "loss": 0.4807,
       "step": 50
     },
     {
       "epoch": 0.18,
       "learning_rate": 0.00016333333333333334,
+      "loss": 0.3915,
       "step": 55
     },
     {
       "epoch": 0.2,
       "learning_rate": 0.00016,
+      "loss": 0.3338,
       "step": 60
     },
     {
       "epoch": 0.22,
       "learning_rate": 0.00015666666666666666,
+      "loss": 0.3527,
       "step": 65
     },
     {
       "epoch": 0.23,
       "learning_rate": 0.00015333333333333334,
+      "loss": 0.4201,
       "step": 70
     },
     {
       "epoch": 0.25,
       "learning_rate": 0.00015000000000000001,
+      "loss": 0.3409,
       "step": 75
     },
     {
       "epoch": 0.27,
       "learning_rate": 0.00014666666666666666,
+      "loss": 0.292,
       "step": 80
     },
     {
       "epoch": 0.28,
       "learning_rate": 0.00014333333333333334,
+      "loss": 0.2662,
       "step": 85
     },
     {
       "epoch": 0.3,
       "learning_rate": 0.00014,
+      "loss": 0.1851,
       "step": 90
     },
     {
       "epoch": 0.32,
       "learning_rate": 0.00013666666666666666,
+      "loss": 0.2833,
       "step": 95
     },
     {
       "epoch": 0.33,
       "learning_rate": 0.00013333333333333334,
+      "loss": 0.2529,
       "step": 100
     },
     {
       "epoch": 0.33,
+      "eval_accuracy": 0.7995833333333333,
+      "eval_f1": 0.7999781610968004,
+      "eval_loss": 0.6368201971054077,
+      "eval_precision": 0.8485966025179182,
+      "eval_recall": 0.7995833333333333,
+      "eval_runtime": 39.9598,
+      "eval_samples_per_second": 60.06,
+      "eval_steps_per_second": 7.508,
       "step": 100
     },
     {
       "epoch": 0.35,
       "learning_rate": 0.00013000000000000002,
+      "loss": 0.1861,
       "step": 105
     },
     {
       "epoch": 0.37,
       "learning_rate": 0.00012666666666666666,
+      "loss": 0.2163,
       "step": 110
     },
     {
       "epoch": 0.38,
       "learning_rate": 0.00012333333333333334,
+      "loss": 0.2439,
       "step": 115
     },
     {
       "epoch": 0.4,
       "learning_rate": 0.00012,
+      "loss": 0.1483,
       "step": 120
     },
     {
       "epoch": 0.42,
       "learning_rate": 0.00011666666666666668,
+      "loss": 0.32,
       "step": 125
     },
     {
       "epoch": 0.43,
       "learning_rate": 0.00011333333333333334,
+      "loss": 0.1636,
       "step": 130
     },
     {
       "epoch": 0.45,
       "learning_rate": 0.00011000000000000002,
+      "loss": 0.3392,
       "step": 135
     },
     {
       "epoch": 0.47,
       "learning_rate": 0.00010666666666666667,
+      "loss": 0.1444,
       "step": 140
     },
     {
       "epoch": 0.48,
       "learning_rate": 0.00010333333333333334,
+      "loss": 0.1844,
       "step": 145
     },
     {
       "epoch": 0.5,
       "learning_rate": 0.0001,
+      "loss": 0.1006,
       "step": 150
     },
     {
       "epoch": 0.52,
       "learning_rate": 9.666666666666667e-05,
+      "loss": 0.1532,
       "step": 155
     },
     {
       "epoch": 0.53,
       "learning_rate": 9.333333333333334e-05,
+      "loss": 0.141,
       "step": 160
     },
     {
       "epoch": 0.55,
       "learning_rate": 9e-05,
+      "loss": 0.1913,
       "step": 165
     },
     {
       "epoch": 0.57,
       "learning_rate": 8.666666666666667e-05,
+      "loss": 0.2348,
       "step": 170
     },
     {
       "epoch": 0.58,
       "learning_rate": 8.333333333333334e-05,
+      "loss": 0.1853,
       "step": 175
     },
     {
       "epoch": 0.6,
       "learning_rate": 8e-05,
+      "loss": 0.0983,
       "step": 180
     },
     {
       "epoch": 0.62,
       "learning_rate": 7.666666666666667e-05,
+      "loss": 0.1056,
       "step": 185
     },
     {
       "epoch": 0.63,
       "learning_rate": 7.333333333333333e-05,
+      "loss": 0.1294,
       "step": 190
     },
     {
       "epoch": 0.65,
       "learning_rate": 7e-05,
+      "loss": 0.2596,
       "step": 195
     },
     {
       "epoch": 0.67,
       "learning_rate": 6.666666666666667e-05,
+      "loss": 0.071,
       "step": 200
     },
     {
       "epoch": 0.67,
+      "eval_accuracy": 0.8141666666666667,
+      "eval_f1": 0.8020156073177751,
+      "eval_loss": 0.6456317901611328,
+      "eval_precision": 0.8425056502644487,
+      "eval_recall": 0.8141666666666667,
+      "eval_runtime": 40.4999,
+      "eval_samples_per_second": 59.259,
+      "eval_steps_per_second": 7.407,
       "step": 200
     },
     {
       "epoch": 0.68,
       "learning_rate": 6.333333333333333e-05,
+      "loss": 0.0858,
       "step": 205
     },
     {
       "epoch": 0.7,
       "learning_rate": 6e-05,
+      "loss": 0.0706,
       "step": 210
     },
     {
       "epoch": 0.72,
       "learning_rate": 5.666666666666667e-05,
+      "loss": 0.0945,
       "step": 215
     },
     {
       "epoch": 0.73,
       "learning_rate": 5.333333333333333e-05,
+      "loss": 0.0459,
       "step": 220
     },
     {
       "epoch": 0.75,
       "learning_rate": 5e-05,
+      "loss": 0.0624,
       "step": 225
     },
     {
       "epoch": 0.77,
       "learning_rate": 4.666666666666667e-05,
+      "loss": 0.0667,
       "step": 230
     },
     {
       "epoch": 0.78,
       "learning_rate": 4.3333333333333334e-05,
+      "loss": 0.0549,
       "step": 235
     },
     {
       "epoch": 0.8,
       "learning_rate": 4e-05,
+      "loss": 0.0667,
       "step": 240
     },
     {
       "epoch": 0.82,
       "learning_rate": 3.6666666666666666e-05,
+      "loss": 0.0426,
       "step": 245
     },
     {
       "epoch": 0.83,
       "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.0449,
       "step": 250
     },
     {
       "epoch": 0.85,
       "learning_rate": 3e-05,
+      "loss": 0.0464,
       "step": 255
     },
     {
       "epoch": 0.87,
       "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.0581,
       "step": 260
     },
     {
       "epoch": 0.88,
       "learning_rate": 2.3333333333333336e-05,
+      "loss": 0.0337,
       "step": 265
     },
     {
       "epoch": 0.9,
       "learning_rate": 2e-05,
+      "loss": 0.0328,
       "step": 270
     },
     {
       "epoch": 0.92,
       "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.0328,
       "step": 275
     },
     {
       "epoch": 0.93,
       "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.0746,
       "step": 280
     },
     {
       "epoch": 0.95,
       "learning_rate": 1e-05,
+      "loss": 0.053,
       "step": 285
     },
     {
       "epoch": 0.97,
       "learning_rate": 6.666666666666667e-06,
+      "loss": 0.0474,
       "step": 290
     },
     {
       "epoch": 0.98,
       "learning_rate": 3.3333333333333333e-06,
+      "loss": 0.0475,
       "step": 295
     },
     {
       "epoch": 1.0,
       "learning_rate": 0.0,
+      "loss": 0.032,
       "step": 300
     },
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.8133333333333334,
+      "eval_f1": 0.8083110647337813,
+      "eval_loss": 0.6355786919593811,
+      "eval_precision": 0.8451020337181513,
+      "eval_recall": 0.8133333333333334,
+      "eval_runtime": 40.497,
+      "eval_samples_per_second": 59.264,
+      "eval_steps_per_second": 7.408,
       "step": 300
     },
     {
       "epoch": 1.0,
       "step": 300,
       "total_flos": 7.43949770489856e+17,
+      "train_loss": 0.28289230664571124,
+      "train_runtime": 269.4002,
+      "train_samples_per_second": 35.635,
+      "train_steps_per_second": 1.114
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:471cc49716b6ab271a0f32070cdaedac19120ba2261dd678da46afb3ab6bcac0
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:f65f2ff84f8592f65ae780faefa90a65ff1d6fa747925b0eef7bdd4456acaadc
 size 4728