End of training

Browse files

Files changed (5) hide show

README.md +2 -2
all_results.json +11 -11
eval_results.json +6 -6
train_results.json +6 -6
trainer_state.json +309 -71

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1550
-- Accuracy: 0.9110
 ## Model description

 This model is a fine-tuned version of [microsoft/swin-tiny-patch4-window7-224](https://huggingface.co/microsoft/swin-tiny-patch4-window7-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1451
+- Accuracy: 0.9247
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 6.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.03769616782665253,
-    "eval_runtime": 0.946,
-    "eval_samples_per_second": 112.046,
-    "eval_steps_per_second": 4.228,
-    "total_flos": 1.4153791066361856e+17,
-    "train_loss": 0.4622622158792284,
-    "train_runtime": 90.8298,
-    "train_samples_per_second": 208.962,
-    "train_steps_per_second": 1.541
 }

 {
+    "epoch": 19.51219512195122,
+    "eval_accuracy": 0.9246575342465754,
+    "eval_loss": 0.14509864151477814,
+    "eval_runtime": 1.219,
+    "eval_samples_per_second": 119.771,
+    "eval_steps_per_second": 4.102,
+    "total_flos": 6.330428470091981e+17,
+    "train_loss": 0.25806016743183136,
+    "train_runtime": 356.8843,
+    "train_samples_per_second": 73.133,
+    "train_steps_per_second": 0.56
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 6.0,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.03769616782665253,
-    "eval_runtime": 0.946,
-    "eval_samples_per_second": 112.046,
-    "eval_steps_per_second": 4.228
 }

 {
+    "epoch": 19.51219512195122,
+    "eval_accuracy": 0.9246575342465754,
+    "eval_loss": 0.14509864151477814,
+    "eval_runtime": 1.219,
+    "eval_samples_per_second": 119.771,
+    "eval_steps_per_second": 4.102
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 6.0,
-    "total_flos": 1.4153791066361856e+17,
-    "train_loss": 0.4622622158792284,
-    "train_runtime": 90.8298,
-    "train_samples_per_second": 208.962,
-    "train_steps_per_second": 1.541
 }

 {
+    "epoch": 19.51219512195122,
+    "total_flos": 6.330428470091981e+17,
+    "train_loss": 0.25806016743183136,
+    "train_runtime": 356.8843,
+    "train_samples_per_second": 73.133,
+    "train_steps_per_second": 0.56
 }

trainer_state.json CHANGED Viewed

@@ -1,107 +1,345 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "/kaggle/working/swin-brain-modality-classification/checkpoint-45",
-  "epoch": 6.0,
   "eval_steps": 500,
-  "global_step": 45,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.9333333333333333,
-      "eval_accuracy": 0.6415094339622641,
-      "eval_loss": 1.0901466608047485,
-      "eval_runtime": 1.0666,
-      "eval_samples_per_second": 99.379,
-      "eval_steps_per_second": 3.75,
-      "step": 7
     },
     {
-      "epoch": 1.3333333333333333,
-      "grad_norm": 5.982262134552002,
-      "learning_rate": 3.571428571428572e-05,
-      "loss": 1.2435,
       "step": 10
     },
     {
-      "epoch": 2.0,
-      "eval_accuracy": 0.8584905660377359,
-      "eval_loss": 0.42658886313438416,
-      "eval_runtime": 0.9395,
-      "eval_samples_per_second": 112.826,
-      "eval_steps_per_second": 4.258,
-      "step": 15
     },
     {
-      "epoch": 2.6666666666666665,
-      "grad_norm": 8.782153129577637,
-      "learning_rate": 4.761904761904762e-05,
-      "loss": 0.5378,
       "step": 20
     },
     {
-      "epoch": 2.9333333333333336,
-      "eval_accuracy": 0.9528301886792453,
-      "eval_loss": 0.15236791968345642,
-      "eval_runtime": 0.9334,
-      "eval_samples_per_second": 113.563,
-      "eval_steps_per_second": 4.285,
-      "step": 22
     },
     {
-      "epoch": 4.0,
-      "grad_norm": 5.220347881317139,
-      "learning_rate": 4.3650793650793655e-05,
-      "loss": 0.1747,
       "step": 30
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.9716981132075472,
-      "eval_loss": 0.07465644180774689,
-      "eval_runtime": 0.9385,
-      "eval_samples_per_second": 112.947,
-      "eval_steps_per_second": 4.262,
-      "step": 30
     },
     {
-      "epoch": 4.933333333333334,
-      "eval_accuracy": 0.9622641509433962,
-      "eval_loss": 0.08645126223564148,
-      "eval_runtime": 0.9952,
-      "eval_samples_per_second": 106.514,
-      "eval_steps_per_second": 4.019,
-      "step": 37
     },
     {
-      "epoch": 5.333333333333333,
-      "grad_norm": 5.531038761138916,
-      "learning_rate": 3.968253968253968e-05,
-      "loss": 0.0905,
-      "step": 40
     },
     {
-      "epoch": 6.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.03769616782665253,
-      "eval_runtime": 1.0531,
-      "eval_samples_per_second": 100.657,
-      "eval_steps_per_second": 3.798,
-      "step": 45
     },
     {
-      "epoch": 6.0,
-      "step": 45,
-      "total_flos": 1.4153791066361856e+17,
-      "train_loss": 0.4622622158792284,
-      "train_runtime": 90.8298,
-      "train_samples_per_second": 208.962,
-      "train_steps_per_second": 1.541
     }
   ],
   "logging_steps": 10,
-  "max_steps": 140,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 20,
   "save_steps": 500,
@@ -126,7 +364,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.4153791066361856e+17,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.9246575342465754,
+  "best_model_checkpoint": "/kaggle/working/swin-brain-modality-classification/checkpoint-82",
+  "epoch": 19.51219512195122,
   "eval_steps": 500,
+  "global_step": 200,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.975609756097561,
+      "grad_norm": 8.406940460205078,
+      "learning_rate": 2.5e-05,
+      "loss": 1.2625,
+      "step": 10
     },
     {
+      "epoch": 0.975609756097561,
+      "eval_accuracy": 0.589041095890411,
+      "eval_loss": 1.0232338905334473,
+      "eval_runtime": 1.1501,
+      "eval_samples_per_second": 126.951,
+      "eval_steps_per_second": 4.348,
       "step": 10
     },
     {
+      "epoch": 1.951219512195122,
+      "grad_norm": 4.960095405578613,
+      "learning_rate": 5e-05,
+      "loss": 0.8162,
+      "step": 20
     },
     {
+      "epoch": 1.951219512195122,
+      "eval_accuracy": 0.8561643835616438,
+      "eval_loss": 0.5372681021690369,
+      "eval_runtime": 1.124,
+      "eval_samples_per_second": 129.89,
+      "eval_steps_per_second": 4.448,
       "step": 20
     },
     {
+      "epoch": 2.926829268292683,
+      "grad_norm": 5.591886043548584,
+      "learning_rate": 4.722222222222222e-05,
+      "loss": 0.3924,
+      "step": 30
     },
     {
+      "epoch": 2.926829268292683,
+      "eval_accuracy": 0.8904109589041096,
+      "eval_loss": 0.24904736876487732,
+      "eval_runtime": 1.1996,
+      "eval_samples_per_second": 121.707,
+      "eval_steps_per_second": 4.168,
       "step": 30
     },
+    {
+      "epoch": 3.902439024390244,
+      "grad_norm": 8.885392189025879,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.2528,
+      "step": 40
+    },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.8767123287671232,
+      "eval_loss": 0.27159520983695984,
+      "eval_runtime": 1.1285,
+      "eval_samples_per_second": 129.37,
+      "eval_steps_per_second": 4.43,
+      "step": 41
     },
     {
+      "epoch": 4.878048780487805,
+      "grad_norm": 5.296258449554443,
+      "learning_rate": 4.166666666666667e-05,
+      "loss": 0.2311,
+      "step": 50
     },
     {
+      "epoch": 4.975609756097561,
+      "eval_accuracy": 0.8904109589041096,
+      "eval_loss": 0.2249891459941864,
+      "eval_runtime": 1.1296,
+      "eval_samples_per_second": 129.247,
+      "eval_steps_per_second": 4.426,
+      "step": 51
+    },
+    {
+      "epoch": 5.853658536585366,
+      "grad_norm": 4.622660160064697,
+      "learning_rate": 3.888888888888889e-05,
+      "loss": 0.2013,
+      "step": 60
+    },
+    {
+      "epoch": 5.951219512195122,
+      "eval_accuracy": 0.910958904109589,
+      "eval_loss": 0.21542568504810333,
+      "eval_runtime": 1.1318,
+      "eval_samples_per_second": 128.996,
+      "eval_steps_per_second": 4.418,
+      "step": 61
+    },
+    {
+      "epoch": 6.829268292682927,
+      "grad_norm": 1.8751587867736816,
+      "learning_rate": 3.611111111111111e-05,
+      "loss": 0.1955,
+      "step": 70
+    },
+    {
+      "epoch": 6.926829268292683,
+      "eval_accuracy": 0.9178082191780822,
+      "eval_loss": 0.17689338326454163,
+      "eval_runtime": 1.1592,
+      "eval_samples_per_second": 125.952,
+      "eval_steps_per_second": 4.313,
+      "step": 71
+    },
+    {
+      "epoch": 7.804878048780488,
+      "grad_norm": 2.4484364986419678,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.1743,
+      "step": 80
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9246575342465754,
+      "eval_loss": 0.14509864151477814,
+      "eval_runtime": 1.129,
+      "eval_samples_per_second": 129.323,
+      "eval_steps_per_second": 4.429,
+      "step": 82
+    },
+    {
+      "epoch": 8.78048780487805,
+      "grad_norm": 4.154516220092773,
+      "learning_rate": 3.055555555555556e-05,
+      "loss": 0.1664,
+      "step": 90
+    },
+    {
+      "epoch": 8.975609756097562,
+      "eval_accuracy": 0.9178082191780822,
+      "eval_loss": 0.1488887518644333,
+      "eval_runtime": 1.1207,
+      "eval_samples_per_second": 130.276,
+      "eval_steps_per_second": 4.462,
+      "step": 92
+    },
+    {
+      "epoch": 9.75609756097561,
+      "grad_norm": 2.7535204887390137,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.1503,
+      "step": 100
+    },
+    {
+      "epoch": 9.951219512195122,
+      "eval_accuracy": 0.8972602739726028,
+      "eval_loss": 0.1964411437511444,
+      "eval_runtime": 1.1259,
+      "eval_samples_per_second": 129.67,
+      "eval_steps_per_second": 4.441,
+      "step": 102
+    },
+    {
+      "epoch": 10.731707317073171,
+      "grad_norm": 3.03983473777771,
+      "learning_rate": 2.5e-05,
+      "loss": 0.1518,
+      "step": 110
+    },
+    {
+      "epoch": 10.926829268292684,
+      "eval_accuracy": 0.910958904109589,
+      "eval_loss": 0.17079411447048187,
+      "eval_runtime": 1.1948,
+      "eval_samples_per_second": 122.195,
+      "eval_steps_per_second": 4.185,
+      "step": 112
+    },
+    {
+      "epoch": 11.707317073170731,
+      "grad_norm": 2.2469286918640137,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.1456,
+      "step": 120
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9041095890410958,
+      "eval_loss": 0.1498766541481018,
+      "eval_runtime": 1.1695,
+      "eval_samples_per_second": 124.845,
+      "eval_steps_per_second": 4.275,
+      "step": 123
+    },
+    {
+      "epoch": 12.682926829268293,
+      "grad_norm": 7.290715217590332,
+      "learning_rate": 1.9444444444444445e-05,
+      "loss": 0.1307,
+      "step": 130
+    },
+    {
+      "epoch": 12.975609756097562,
+      "eval_accuracy": 0.9041095890410958,
+      "eval_loss": 0.15838505327701569,
+      "eval_runtime": 1.122,
+      "eval_samples_per_second": 130.13,
+      "eval_steps_per_second": 4.457,
+      "step": 133
+    },
+    {
+      "epoch": 13.658536585365853,
+      "grad_norm": 4.910462379455566,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.1546,
+      "step": 140
+    },
+    {
+      "epoch": 13.951219512195122,
+      "eval_accuracy": 0.910958904109589,
+      "eval_loss": 0.16728605329990387,
+      "eval_runtime": 1.1455,
+      "eval_samples_per_second": 127.459,
+      "eval_steps_per_second": 4.365,
+      "step": 143
+    },
+    {
+      "epoch": 14.634146341463415,
+      "grad_norm": 3.007720947265625,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.1282,
+      "step": 150
+    },
+    {
+      "epoch": 14.926829268292684,
+      "eval_accuracy": 0.9041095890410958,
+      "eval_loss": 0.15455295145511627,
+      "eval_runtime": 1.1933,
+      "eval_samples_per_second": 122.354,
+      "eval_steps_per_second": 4.19,
+      "step": 153
+    },
+    {
+      "epoch": 15.609756097560975,
+      "grad_norm": 3.2155206203460693,
+      "learning_rate": 1.1111111111111112e-05,
+      "loss": 0.121,
+      "step": 160
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.9041095890410958,
+      "eval_loss": 0.163113534450531,
+      "eval_runtime": 1.1449,
+      "eval_samples_per_second": 127.52,
+      "eval_steps_per_second": 4.367,
+      "step": 164
+    },
+    {
+      "epoch": 16.585365853658537,
+      "grad_norm": 2.8936450481414795,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 0.1311,
+      "step": 170
+    },
+    {
+      "epoch": 16.975609756097562,
+      "eval_accuracy": 0.9041095890410958,
+      "eval_loss": 0.148574560880661,
+      "eval_runtime": 1.1408,
+      "eval_samples_per_second": 127.98,
+      "eval_steps_per_second": 4.383,
+      "step": 174
+    },
+    {
+      "epoch": 17.5609756097561,
+      "grad_norm": 3.644867420196533,
+      "learning_rate": 5.555555555555556e-06,
+      "loss": 0.1259,
+      "step": 180
+    },
+    {
+      "epoch": 17.951219512195124,
+      "eval_accuracy": 0.9178082191780822,
+      "eval_loss": 0.1642705798149109,
+      "eval_runtime": 1.1481,
+      "eval_samples_per_second": 127.169,
+      "eval_steps_per_second": 4.355,
+      "step": 184
+    },
+    {
+      "epoch": 18.536585365853657,
+      "grad_norm": 3.4987175464630127,
+      "learning_rate": 2.777777777777778e-06,
+      "loss": 0.1254,
+      "step": 190
+    },
+    {
+      "epoch": 18.926829268292682,
+      "eval_accuracy": 0.910958904109589,
+      "eval_loss": 0.15694867074489594,
+      "eval_runtime": 1.1825,
+      "eval_samples_per_second": 123.462,
+      "eval_steps_per_second": 4.228,
+      "step": 194
+    },
+    {
+      "epoch": 19.51219512195122,
+      "grad_norm": 3.0996928215026855,
+      "learning_rate": 0.0,
+      "loss": 0.1039,
+      "step": 200
     },
     {
+      "epoch": 19.51219512195122,
+      "eval_accuracy": 0.910958904109589,
+      "eval_loss": 0.1550000011920929,
+      "eval_runtime": 1.2474,
+      "eval_samples_per_second": 117.047,
+      "eval_steps_per_second": 4.008,
+      "step": 200
     },
     {
+      "epoch": 19.51219512195122,
+      "step": 200,
+      "total_flos": 6.330428470091981e+17,
+      "train_loss": 0.25806016743183136,
+      "train_runtime": 356.8843,
+      "train_samples_per_second": 73.133,
+      "train_steps_per_second": 0.56
     }
   ],
   "logging_steps": 10,
+  "max_steps": 200,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 20,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 6.330428470091981e+17,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null