End of training

Browse files

Files changed (9) hide show

README.md +44 -44
all_results.json +9 -9
eval_results.json +5 -5
model.safetensors +1 -1
runs/Dec01_19-11-43_DESKTOP-SKBE9FB/events.out.tfevents.1733101904.DESKTOP-SKBE9FB.5632.0 +3 -0
runs/Dec01_19-11-43_DESKTOP-SKBE9FB/events.out.tfevents.1733102475.DESKTOP-SKBE9FB.5632.1 +3 -0
train_results.json +4 -4
trainer_state.json +254 -254
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.6448598130841121
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6681
-- Accuracy: 0.6449
 ## Model description
@@ -52,7 +52,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.00015
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
@@ -67,46 +67,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 1.0   | 8    | 4.5659          | 0.4112   |
-| 4.5175        | 2.0   | 16   | 3.6362          | 0.4112   |
-| 3.9284        | 3.0   | 24   | 1.6019          | 0.4112   |
-| 1.6086        | 4.0   | 32   | 0.7110          | 0.4112   |
-| 0.7392        | 5.0   | 40   | 0.6825          | 0.5888   |
-| 0.7392        | 6.0   | 48   | 0.6795          | 0.5888   |
-| 0.7073        | 7.0   | 56   | 0.6814          | 0.5888   |
-| 0.6956        | 8.0   | 64   | 0.7061          | 0.5888   |
-| 0.6898        | 9.0   | 72   | 0.7014          | 0.5888   |
-| 0.7026        | 10.0  | 80   | 0.7214          | 0.4112   |
-| 0.7026        | 11.0  | 88   | 0.7186          | 0.5888   |
-| 0.7696        | 12.0  | 96   | 0.6837          | 0.5888   |
-| 0.6909        | 13.0  | 104  | 0.6823          | 0.5888   |
-| 0.6799        | 14.0  | 112  | 0.6781          | 0.5888   |
-| 0.6782        | 15.0  | 120  | 0.6938          | 0.5888   |
-| 0.6782        | 16.0  | 128  | 0.6766          | 0.5888   |
-| 0.6952        | 17.0  | 136  | 0.7123          | 0.5888   |
-| 0.6875        | 18.0  | 144  | 0.6891          | 0.5607   |
-| 0.6919        | 19.0  | 152  | 0.7076          | 0.5888   |
-| 0.6751        | 20.0  | 160  | 0.7011          | 0.4953   |
-| 0.6751        | 21.0  | 168  | 0.6962          | 0.5888   |
-| 0.689         | 22.0  | 176  | 0.6857          | 0.5701   |
-| 0.6826        | 23.0  | 184  | 0.6935          | 0.5888   |
-| 0.6841        | 24.0  | 192  | 0.7219          | 0.5888   |
-| 0.6657        | 25.0  | 200  | 0.6610          | 0.5888   |
-| 0.6657        | 26.0  | 208  | 0.6681          | 0.6449   |
-| 0.6524        | 27.0  | 216  | 0.7225          | 0.5888   |
-| 0.6567        | 28.0  | 224  | 0.7117          | 0.5888   |
-| 0.6402        | 29.0  | 232  | 0.6999          | 0.6262   |
-| 0.66          | 30.0  | 240  | 0.6799          | 0.6075   |
-| 0.66          | 31.0  | 248  | 0.6677          | 0.6075   |
-| 0.6469        | 32.0  | 256  | 0.6735          | 0.5981   |
-| 0.6355        | 33.0  | 264  | 0.6853          | 0.6168   |
-| 0.6245        | 34.0  | 272  | 0.7008          | 0.6262   |
-| 0.6306        | 35.0  | 280  | 0.6990          | 0.5981   |
-| 0.6306        | 36.0  | 288  | 0.6981          | 0.6355   |
-| 0.6208        | 37.0  | 296  | 0.7103          | 0.6262   |
-| 0.6339        | 38.0  | 304  | 0.7050          | 0.6355   |
-| 0.5959        | 39.0  | 312  | 0.6989          | 0.6355   |
-| 0.6059        | 40.0  | 320  | 0.6990          | 0.6355   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.6822429906542056
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6396
+- Accuracy: 0.6822
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 4e-05
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 1.0   | 8    | 4.6265          | 0.4112   |
+| 4.5369        | 2.0   | 16   | 4.5295          | 0.4112   |
+| 4.6305        | 3.0   | 24   | 4.1439          | 0.4112   |
+| 4.0918        | 4.0   | 32   | 3.3693          | 0.4112   |
+| 3.1767        | 5.0   | 40   | 2.4325          | 0.4112   |
+| 3.1767        | 6.0   | 48   | 1.5422          | 0.4112   |
+| 2.0113        | 7.0   | 56   | 0.8834          | 0.4112   |
+| 1.0593        | 8.0   | 64   | 0.6790          | 0.5888   |
+| 0.696         | 9.0   | 72   | 0.7044          | 0.5888   |
+| 0.6893        | 10.0  | 80   | 0.6778          | 0.5888   |
+| 0.6893        | 11.0  | 88   | 0.6866          | 0.5888   |
+| 0.6961        | 12.0  | 96   | 0.6934          | 0.5888   |
+| 0.7329        | 13.0  | 104  | 0.6915          | 0.5888   |
+| 0.6948        | 14.0  | 112  | 0.6762          | 0.5888   |
+| 0.6771        | 15.0  | 120  | 0.6795          | 0.5888   |
+| 0.6771        | 16.0  | 128  | 0.6801          | 0.5888   |
+| 0.6763        | 17.0  | 136  | 0.6820          | 0.5888   |
+| 0.6822        | 18.0  | 144  | 0.6800          | 0.5888   |
+| 0.6723        | 19.0  | 152  | 0.6741          | 0.5888   |
+| 0.6757        | 20.0  | 160  | 0.6815          | 0.5888   |
+| 0.6757        | 21.0  | 168  | 0.6729          | 0.5888   |
+| 0.6711        | 22.0  | 176  | 0.6812          | 0.5888   |
+| 0.6784        | 23.0  | 184  | 0.6781          | 0.5794   |
+| 0.6665        | 24.0  | 192  | 0.6698          | 0.5794   |
+| 0.6723        | 25.0  | 200  | 0.6647          | 0.5981   |
+| 0.6723        | 26.0  | 208  | 0.6762          | 0.5794   |
+| 0.6675        | 27.0  | 216  | 0.6597          | 0.5701   |
+| 0.6628        | 28.0  | 224  | 0.6563          | 0.6355   |
+| 0.6478        | 29.0  | 232  | 0.6791          | 0.5794   |
+| 0.6642        | 30.0  | 240  | 0.6574          | 0.5888   |
+| 0.6642        | 31.0  | 248  | 0.6556          | 0.5607   |
+| 0.654         | 32.0  | 256  | 0.6523          | 0.5888   |
+| 0.6602        | 33.0  | 264  | 0.6464          | 0.6262   |
+| 0.6535        | 34.0  | 272  | 0.6450          | 0.6168   |
+| 0.6506        | 35.0  | 280  | 0.6550          | 0.5794   |
+| 0.6506        | 36.0  | 288  | 0.6438          | 0.6075   |
+| 0.6533        | 37.0  | 296  | 0.6396          | 0.6822   |
+| 0.6443        | 38.0  | 304  | 0.6383          | 0.6636   |
+| 0.6263        | 39.0  | 312  | 0.6378          | 0.6449   |
+| 0.6283        | 40.0  | 320  | 0.6379          | 0.6449   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 40.0,
-    "eval_accuracy": 0.6448598130841121,
-    "eval_loss": 0.6681405305862427,
-    "eval_runtime": 2.1165,
-    "eval_samples_per_second": 50.556,
-    "eval_steps_per_second": 3.307,
-    "train_loss": 0.9213116973638534,
-    "train_runtime": 581.2908,
-    "train_samples_per_second": 34.269,
-    "train_steps_per_second": 0.55
 }

 {
     "epoch": 40.0,
+    "eval_accuracy": 0.6822429906542056,
+    "eval_loss": 0.6395505666732788,
+    "eval_runtime": 1.971,
+    "eval_samples_per_second": 54.288,
+    "eval_steps_per_second": 3.552,
+    "train_loss": 1.1531404286623002,
+    "train_runtime": 569.0029,
+    "train_samples_per_second": 35.009,
+    "train_steps_per_second": 0.562
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 40.0,
-    "eval_accuracy": 0.6448598130841121,
-    "eval_loss": 0.6681405305862427,
-    "eval_runtime": 2.1165,
-    "eval_samples_per_second": 50.556,
-    "eval_steps_per_second": 3.307
 }

 {
     "epoch": 40.0,
+    "eval_accuracy": 0.6822429906542056,
+    "eval_loss": 0.6395505666732788,
+    "eval_runtime": 1.971,
+    "eval_samples_per_second": 54.288,
+    "eval_steps_per_second": 3.552
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6be82f55800482222ec52265737ecf590a2ed114bb2716e0ce24c4dc4443a322
 size 110350128

 version https://git-lfs.github.com/spec/v1
+oid sha256:65de1007e53d84849bf77cba6491b1b90ffc48c80769e0d3eac6bb172d6e6d23
 size 110350128

runs/Dec01_19-11-43_DESKTOP-SKBE9FB/events.out.tfevents.1733101904.DESKTOP-SKBE9FB.5632.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6ca5bb44bf6d5dac75e7187e391c40ab012431b2530c30f26e747fcdf8733c5e
+size 22870

runs/Dec01_19-11-43_DESKTOP-SKBE9FB/events.out.tfevents.1733102475.DESKTOP-SKBE9FB.5632.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:77d00c1cc2cd9dfe2fe50adad5e853ad9b511e866d1ef303e5e4e5a7261df6b0
+size 411

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 40.0,
-    "train_loss": 0.9213116973638534,
-    "train_runtime": 581.2908,
-    "train_samples_per_second": 34.269,
-    "train_steps_per_second": 0.55
 }

 {
     "epoch": 40.0,
+    "train_loss": 1.1531404286623002,
+    "train_runtime": 569.0029,
+    "train_samples_per_second": 35.009,
+    "train_steps_per_second": 0.562
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.6448598130841121,
-  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-RH\\checkpoint-208",
   "epoch": 40.0,
   "eval_steps": 500,
   "global_step": 320,
@@ -11,563 +11,563 @@
     {
       "epoch": 1.0,
       "eval_accuracy": 0.411214953271028,
-      "eval_loss": 4.565852165222168,
-      "eval_runtime": 1.9881,
-      "eval_samples_per_second": 53.821,
-      "eval_steps_per_second": 3.521,
       "step": 8
     },
     {
       "epoch": 1.25,
-      "learning_rate": 4.6874999999999994e-05,
-      "loss": 4.5175,
       "step": 10
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.411214953271028,
-      "eval_loss": 3.636173963546753,
-      "eval_runtime": 1.951,
-      "eval_samples_per_second": 54.845,
-      "eval_steps_per_second": 3.588,
       "step": 16
     },
     {
       "epoch": 2.5,
-      "learning_rate": 9.374999999999999e-05,
-      "loss": 3.9284,
       "step": 20
     },
     {
       "epoch": 3.0,
       "eval_accuracy": 0.411214953271028,
-      "eval_loss": 1.6019313335418701,
-      "eval_runtime": 1.8634,
-      "eval_samples_per_second": 57.421,
-      "eval_steps_per_second": 3.757,
       "step": 24
     },
     {
       "epoch": 3.75,
-      "learning_rate": 0.000140625,
-      "loss": 1.6086,
       "step": 30
     },
     {
       "epoch": 4.0,
       "eval_accuracy": 0.411214953271028,
-      "eval_loss": 0.7110145092010498,
-      "eval_runtime": 1.8614,
-      "eval_samples_per_second": 57.482,
-      "eval_steps_per_second": 3.761,
       "step": 32
     },
     {
       "epoch": 5.0,
-      "learning_rate": 0.00014583333333333332,
-      "loss": 0.7392,
       "step": 40
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6824622750282288,
-      "eval_runtime": 1.8634,
-      "eval_samples_per_second": 57.42,
-      "eval_steps_per_second": 3.756,
       "step": 40
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.679547905921936,
-      "eval_runtime": 1.9335,
-      "eval_samples_per_second": 55.341,
-      "eval_steps_per_second": 3.62,
       "step": 48
     },
     {
       "epoch": 6.25,
-      "learning_rate": 0.000140625,
-      "loss": 0.7073,
       "step": 50
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6814281940460205,
-      "eval_runtime": 1.8789,
-      "eval_samples_per_second": 56.947,
-      "eval_steps_per_second": 3.725,
       "step": 56
     },
     {
       "epoch": 7.5,
-      "learning_rate": 0.00013541666666666666,
-      "loss": 0.6956,
       "step": 60
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7060601711273193,
-      "eval_runtime": 1.8394,
-      "eval_samples_per_second": 58.17,
-      "eval_steps_per_second": 3.805,
       "step": 64
     },
     {
       "epoch": 8.75,
-      "learning_rate": 0.00013020833333333333,
-      "loss": 0.6898,
       "step": 70
     },
     {
       "epoch": 9.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7014247179031372,
-      "eval_runtime": 1.9775,
-      "eval_samples_per_second": 54.11,
-      "eval_steps_per_second": 3.54,
       "step": 72
     },
     {
       "epoch": 10.0,
-      "learning_rate": 0.000125,
-      "loss": 0.7026,
       "step": 80
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.411214953271028,
-      "eval_loss": 0.7213616967201233,
-      "eval_runtime": 1.881,
-      "eval_samples_per_second": 56.886,
-      "eval_steps_per_second": 3.721,
       "step": 80
     },
     {
       "epoch": 11.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7185712456703186,
-      "eval_runtime": 1.9299,
-      "eval_samples_per_second": 55.442,
-      "eval_steps_per_second": 3.627,
       "step": 88
     },
     {
       "epoch": 11.25,
-      "learning_rate": 0.00011979166666666666,
-      "loss": 0.7696,
       "step": 90
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6837121844291687,
-      "eval_runtime": 1.8429,
-      "eval_samples_per_second": 58.06,
-      "eval_steps_per_second": 3.798,
       "step": 96
     },
     {
       "epoch": 12.5,
-      "learning_rate": 0.00011458333333333332,
-      "loss": 0.6909,
       "step": 100
     },
     {
       "epoch": 13.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6822527647018433,
-      "eval_runtime": 1.8714,
-      "eval_samples_per_second": 57.175,
-      "eval_steps_per_second": 3.74,
       "step": 104
     },
     {
       "epoch": 13.75,
-      "learning_rate": 0.00010937499999999999,
-      "loss": 0.6799,
       "step": 110
     },
     {
       "epoch": 14.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6780915260314941,
-      "eval_runtime": 1.8835,
-      "eval_samples_per_second": 56.811,
-      "eval_steps_per_second": 3.717,
       "step": 112
     },
     {
       "epoch": 15.0,
-      "learning_rate": 0.00010416666666666666,
-      "loss": 0.6782,
       "step": 120
     },
     {
       "epoch": 15.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6938412189483643,
-      "eval_runtime": 2.0385,
-      "eval_samples_per_second": 52.489,
-      "eval_steps_per_second": 3.434,
       "step": 120
     },
     {
       "epoch": 16.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6766122579574585,
-      "eval_runtime": 2.019,
-      "eval_samples_per_second": 52.997,
-      "eval_steps_per_second": 3.467,
       "step": 128
     },
     {
       "epoch": 16.25,
-      "learning_rate": 9.895833333333332e-05,
-      "loss": 0.6952,
       "step": 130
     },
     {
       "epoch": 17.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7123367190361023,
-      "eval_runtime": 1.8724,
-      "eval_samples_per_second": 57.145,
-      "eval_steps_per_second": 3.738,
       "step": 136
     },
     {
       "epoch": 17.5,
-      "learning_rate": 9.374999999999999e-05,
-      "loss": 0.6875,
       "step": 140
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.5607476635514018,
-      "eval_loss": 0.6890613436698914,
-      "eval_runtime": 1.9095,
-      "eval_samples_per_second": 56.037,
-      "eval_steps_per_second": 3.666,
       "step": 144
     },
     {
       "epoch": 18.75,
-      "learning_rate": 8.854166666666666e-05,
-      "loss": 0.6919,
       "step": 150
     },
     {
       "epoch": 19.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7076395153999329,
-      "eval_runtime": 1.941,
-      "eval_samples_per_second": 55.127,
-      "eval_steps_per_second": 3.606,
       "step": 152
     },
     {
       "epoch": 20.0,
-      "learning_rate": 8.333333333333333e-05,
-      "loss": 0.6751,
       "step": 160
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.4953271028037383,
-      "eval_loss": 0.7010804414749146,
-      "eval_runtime": 1.8779,
-      "eval_samples_per_second": 56.977,
-      "eval_steps_per_second": 3.727,
       "step": 160
     },
     {
       "epoch": 21.0,
       "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6961632966995239,
-      "eval_runtime": 1.8549,
-      "eval_samples_per_second": 57.684,
-      "eval_steps_per_second": 3.774,
       "step": 168
     },
     {
       "epoch": 21.25,
-      "learning_rate": 7.8125e-05,
-      "loss": 0.689,
       "step": 170
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.5700934579439252,
-      "eval_loss": 0.6856827139854431,
-      "eval_runtime": 1.8844,
-      "eval_samples_per_second": 56.781,
-      "eval_steps_per_second": 3.715,
       "step": 176
     },
     {
       "epoch": 22.5,
-      "learning_rate": 7.291666666666666e-05,
-      "loss": 0.6826,
       "step": 180
     },
     {
       "epoch": 23.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6935387253761292,
-      "eval_runtime": 1.9324,
-      "eval_samples_per_second": 55.37,
-      "eval_steps_per_second": 3.622,
       "step": 184
     },
     {
       "epoch": 23.75,
-      "learning_rate": 6.770833333333333e-05,
-      "loss": 0.6841,
       "step": 190
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7218518853187561,
-      "eval_runtime": 1.9105,
-      "eval_samples_per_second": 56.008,
-      "eval_steps_per_second": 3.664,
       "step": 192
     },
     {
       "epoch": 25.0,
-      "learning_rate": 6.25e-05,
-      "loss": 0.6657,
       "step": 200
     },
     {
       "epoch": 25.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.6609508395195007,
-      "eval_runtime": 1.8645,
-      "eval_samples_per_second": 57.39,
-      "eval_steps_per_second": 3.754,
       "step": 200
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.6448598130841121,
-      "eval_loss": 0.6681405305862427,
-      "eval_runtime": 1.8574,
-      "eval_samples_per_second": 57.607,
-      "eval_steps_per_second": 3.769,
       "step": 208
     },
     {
       "epoch": 26.25,
-      "learning_rate": 5.729166666666666e-05,
-      "loss": 0.6524,
       "step": 210
     },
     {
       "epoch": 27.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7224901914596558,
-      "eval_runtime": 1.881,
-      "eval_samples_per_second": 56.886,
-      "eval_steps_per_second": 3.722,
       "step": 216
     },
     {
       "epoch": 27.5,
-      "learning_rate": 5.208333333333333e-05,
-      "loss": 0.6567,
       "step": 220
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.5887850467289719,
-      "eval_loss": 0.7117226719856262,
-      "eval_runtime": 1.9114,
-      "eval_samples_per_second": 55.979,
-      "eval_steps_per_second": 3.662,
       "step": 224
     },
     {
       "epoch": 28.75,
-      "learning_rate": 4.6874999999999994e-05,
-      "loss": 0.6402,
       "step": 230
     },
     {
       "epoch": 29.0,
-      "eval_accuracy": 0.6261682242990654,
-      "eval_loss": 0.6999447345733643,
-      "eval_runtime": 1.913,
-      "eval_samples_per_second": 55.934,
-      "eval_steps_per_second": 3.659,
       "step": 232
     },
     {
       "epoch": 30.0,
-      "learning_rate": 4.1666666666666665e-05,
-      "loss": 0.66,
       "step": 240
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.6074766355140186,
-      "eval_loss": 0.6799367070198059,
-      "eval_runtime": 1.8619,
-      "eval_samples_per_second": 57.467,
-      "eval_steps_per_second": 3.76,
       "step": 240
     },
     {
       "epoch": 31.0,
-      "eval_accuracy": 0.6074766355140186,
-      "eval_loss": 0.6676725745201111,
-      "eval_runtime": 1.8574,
-      "eval_samples_per_second": 57.606,
-      "eval_steps_per_second": 3.769,
       "step": 248
     },
     {
       "epoch": 31.25,
-      "learning_rate": 3.645833333333333e-05,
-      "loss": 0.6469,
       "step": 250
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.5981308411214953,
-      "eval_loss": 0.6734670996665955,
-      "eval_runtime": 1.8664,
-      "eval_samples_per_second": 57.329,
-      "eval_steps_per_second": 3.75,
       "step": 256
     },
     {
       "epoch": 32.5,
-      "learning_rate": 3.125e-05,
-      "loss": 0.6355,
       "step": 260
     },
     {
       "epoch": 33.0,
-      "eval_accuracy": 0.616822429906542,
-      "eval_loss": 0.6852976083755493,
-      "eval_runtime": 2.0311,
-      "eval_samples_per_second": 52.681,
-      "eval_steps_per_second": 3.446,
       "step": 264
     },
     {
       "epoch": 33.75,
-      "learning_rate": 2.6041666666666665e-05,
-      "loss": 0.6245,
       "step": 270
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.6261682242990654,
-      "eval_loss": 0.7008370161056519,
-      "eval_runtime": 1.8744,
-      "eval_samples_per_second": 57.084,
-      "eval_steps_per_second": 3.734,
       "step": 272
     },
     {
       "epoch": 35.0,
-      "learning_rate": 2.0833333333333333e-05,
-      "loss": 0.6306,
       "step": 280
     },
     {
       "epoch": 35.0,
-      "eval_accuracy": 0.5981308411214953,
-      "eval_loss": 0.6990097761154175,
-      "eval_runtime": 1.9194,
-      "eval_samples_per_second": 55.745,
-      "eval_steps_per_second": 3.647,
       "step": 280
     },
     {
       "epoch": 36.0,
-      "eval_accuracy": 0.6355140186915887,
-      "eval_loss": 0.6980569958686829,
-      "eval_runtime": 1.9115,
-      "eval_samples_per_second": 55.978,
-      "eval_steps_per_second": 3.662,
       "step": 288
     },
     {
       "epoch": 36.25,
-      "learning_rate": 1.5625e-05,
-      "loss": 0.6208,
       "step": 290
     },
     {
       "epoch": 37.0,
-      "eval_accuracy": 0.6261682242990654,
-      "eval_loss": 0.7103211879730225,
-      "eval_runtime": 1.9169,
-      "eval_samples_per_second": 55.818,
-      "eval_steps_per_second": 3.652,
       "step": 296
     },
     {
       "epoch": 37.5,
-      "learning_rate": 1.0416666666666666e-05,
-      "loss": 0.6339,
       "step": 300
     },
     {
       "epoch": 38.0,
-      "eval_accuracy": 0.6355140186915887,
-      "eval_loss": 0.7050479054450989,
-      "eval_runtime": 1.9345,
-      "eval_samples_per_second": 55.312,
-      "eval_steps_per_second": 3.619,
       "step": 304
     },
     {
       "epoch": 38.75,
-      "learning_rate": 5.208333333333333e-06,
-      "loss": 0.5959,
       "step": 310
     },
     {
       "epoch": 39.0,
-      "eval_accuracy": 0.6355140186915887,
-      "eval_loss": 0.698934018611908,
-      "eval_runtime": 1.8634,
-      "eval_samples_per_second": 57.421,
-      "eval_steps_per_second": 3.757,
       "step": 312
     },
     {
       "epoch": 40.0,
       "learning_rate": 0.0,
-      "loss": 0.6059,
       "step": 320
     },
     {
       "epoch": 40.0,
-      "eval_accuracy": 0.6355140186915887,
-      "eval_loss": 0.6989688277244568,
-      "eval_runtime": 1.8409,
-      "eval_samples_per_second": 58.123,
-      "eval_steps_per_second": 3.802,
       "step": 320
     },
     {
       "epoch": 40.0,
       "step": 320,
       "total_flos": 6.480838238876467e+17,
-      "train_loss": 0.9213116973638534,
-      "train_runtime": 581.2908,
-      "train_samples_per_second": 34.269,
-      "train_steps_per_second": 0.55
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.6822429906542056,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-RH\\checkpoint-296",
   "epoch": 40.0,
   "eval_steps": 500,
   "global_step": 320,
     {
       "epoch": 1.0,
       "eval_accuracy": 0.411214953271028,
+      "eval_loss": 4.626469612121582,
+      "eval_runtime": 1.941,
+      "eval_samples_per_second": 55.127,
+      "eval_steps_per_second": 3.606,
       "step": 8
     },
     {
       "epoch": 1.25,
+      "learning_rate": 1.25e-05,
+      "loss": 4.5369,
       "step": 10
     },
     {
       "epoch": 2.0,
       "eval_accuracy": 0.411214953271028,
+      "eval_loss": 4.52950382232666,
+      "eval_runtime": 1.8274,
+      "eval_samples_per_second": 58.552,
+      "eval_steps_per_second": 3.831,
       "step": 16
     },
     {
       "epoch": 2.5,
+      "learning_rate": 2.5e-05,
+      "loss": 4.6305,
       "step": 20
     },
     {
       "epoch": 3.0,
       "eval_accuracy": 0.411214953271028,
+      "eval_loss": 4.143911361694336,
+      "eval_runtime": 1.8444,
+      "eval_samples_per_second": 58.012,
+      "eval_steps_per_second": 3.795,
       "step": 24
     },
     {
       "epoch": 3.75,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 4.0918,
       "step": 30
     },
     {
       "epoch": 4.0,
       "eval_accuracy": 0.411214953271028,
+      "eval_loss": 3.369269609451294,
+      "eval_runtime": 1.8599,
+      "eval_samples_per_second": 57.529,
+      "eval_steps_per_second": 3.764,
       "step": 32
     },
     {
       "epoch": 5.0,
+      "learning_rate": 3.888888888888889e-05,
+      "loss": 3.1767,
       "step": 40
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.411214953271028,
+      "eval_loss": 2.4324560165405273,
+      "eval_runtime": 1.894,
+      "eval_samples_per_second": 56.496,
+      "eval_steps_per_second": 3.696,
       "step": 40
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.411214953271028,
+      "eval_loss": 1.5421515703201294,
+      "eval_runtime": 1.8605,
+      "eval_samples_per_second": 57.513,
+      "eval_steps_per_second": 3.763,
       "step": 48
     },
     {
       "epoch": 6.25,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 2.0113,
       "step": 50
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.411214953271028,
+      "eval_loss": 0.8834472894668579,
+      "eval_runtime": 1.8524,
+      "eval_samples_per_second": 57.762,
+      "eval_steps_per_second": 3.779,
       "step": 56
     },
     {
       "epoch": 7.5,
+      "learning_rate": 3.6111111111111116e-05,
+      "loss": 1.0593,
       "step": 60
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6790158748626709,
+      "eval_runtime": 1.8709,
+      "eval_samples_per_second": 57.19,
+      "eval_steps_per_second": 3.741,
       "step": 64
     },
     {
       "epoch": 8.75,
+      "learning_rate": 3.472222222222223e-05,
+      "loss": 0.696,
       "step": 70
     },
     {
       "epoch": 9.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.7044364213943481,
+      "eval_runtime": 1.8454,
+      "eval_samples_per_second": 57.981,
+      "eval_steps_per_second": 3.793,
       "step": 72
     },
     {
       "epoch": 10.0,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.6893,
       "step": 80
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6777833104133606,
+      "eval_runtime": 1.8339,
+      "eval_samples_per_second": 58.344,
+      "eval_steps_per_second": 3.817,
       "step": 80
     },
     {
       "epoch": 11.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.686574399471283,
+      "eval_runtime": 1.8689,
+      "eval_samples_per_second": 57.252,
+      "eval_steps_per_second": 3.745,
       "step": 88
     },
     {
       "epoch": 11.25,
+      "learning_rate": 3.194444444444445e-05,
+      "loss": 0.6961,
       "step": 90
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6933708786964417,
+      "eval_runtime": 1.8659,
+      "eval_samples_per_second": 57.344,
+      "eval_steps_per_second": 3.751,
       "step": 96
     },
     {
       "epoch": 12.5,
+      "learning_rate": 3.0555555555555554e-05,
+      "loss": 0.7329,
       "step": 100
     },
     {
       "epoch": 13.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6915177702903748,
+      "eval_runtime": 1.8689,
+      "eval_samples_per_second": 57.252,
+      "eval_steps_per_second": 3.745,
       "step": 104
     },
     {
       "epoch": 13.75,
+      "learning_rate": 2.9166666666666666e-05,
+      "loss": 0.6948,
       "step": 110
     },
     {
       "epoch": 14.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6761561036109924,
+      "eval_runtime": 1.873,
+      "eval_samples_per_second": 57.129,
+      "eval_steps_per_second": 3.737,
       "step": 112
     },
     {
       "epoch": 15.0,
+      "learning_rate": 2.777777777777778e-05,
+      "loss": 0.6771,
       "step": 120
     },
     {
       "epoch": 15.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6794873476028442,
+      "eval_runtime": 1.8549,
+      "eval_samples_per_second": 57.684,
+      "eval_steps_per_second": 3.774,
       "step": 120
     },
     {
       "epoch": 16.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6800874471664429,
+      "eval_runtime": 1.871,
+      "eval_samples_per_second": 57.19,
+      "eval_steps_per_second": 3.741,
       "step": 128
     },
     {
       "epoch": 16.25,
+      "learning_rate": 2.6388888888888892e-05,
+      "loss": 0.6763,
       "step": 130
     },
     {
       "epoch": 17.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6819825172424316,
+      "eval_runtime": 1.8614,
+      "eval_samples_per_second": 57.483,
+      "eval_steps_per_second": 3.761,
       "step": 136
     },
     {
       "epoch": 17.5,
+      "learning_rate": 2.5e-05,
+      "loss": 0.6822,
       "step": 140
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6799528002738953,
+      "eval_runtime": 1.8664,
+      "eval_samples_per_second": 57.328,
+      "eval_steps_per_second": 3.75,
       "step": 144
     },
     {
       "epoch": 18.75,
+      "learning_rate": 2.3611111111111114e-05,
+      "loss": 0.6723,
       "step": 150
     },
     {
       "epoch": 19.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6740810871124268,
+      "eval_runtime": 1.8689,
+      "eval_samples_per_second": 57.252,
+      "eval_steps_per_second": 3.745,
       "step": 152
     },
     {
       "epoch": 20.0,
+      "learning_rate": 2.2222222222222227e-05,
+      "loss": 0.6757,
       "step": 160
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.681536078453064,
+      "eval_runtime": 1.8439,
+      "eval_samples_per_second": 58.028,
+      "eval_steps_per_second": 3.796,
       "step": 160
     },
     {
       "epoch": 21.0,
       "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6728676557540894,
+      "eval_runtime": 1.8774,
+      "eval_samples_per_second": 56.993,
+      "eval_steps_per_second": 3.729,
       "step": 168
     },
     {
       "epoch": 21.25,
+      "learning_rate": 2.0833333333333336e-05,
+      "loss": 0.6711,
       "step": 170
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6811678409576416,
+      "eval_runtime": 1.8474,
+      "eval_samples_per_second": 57.918,
+      "eval_steps_per_second": 3.789,
       "step": 176
     },
     {
       "epoch": 22.5,
+      "learning_rate": 1.9444444444444445e-05,
+      "loss": 0.6784,
       "step": 180
     },
     {
       "epoch": 23.0,
+      "eval_accuracy": 0.5794392523364486,
+      "eval_loss": 0.6780757308006287,
+      "eval_runtime": 1.9144,
+      "eval_samples_per_second": 55.891,
+      "eval_steps_per_second": 3.656,
       "step": 184
     },
     {
       "epoch": 23.75,
+      "learning_rate": 1.8055555555555558e-05,
+      "loss": 0.6665,
       "step": 190
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.5794392523364486,
+      "eval_loss": 0.6697570085525513,
+      "eval_runtime": 1.8669,
+      "eval_samples_per_second": 57.313,
+      "eval_steps_per_second": 3.749,
       "step": 192
     },
     {
       "epoch": 25.0,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.6723,
       "step": 200
     },
     {
       "epoch": 25.0,
+      "eval_accuracy": 0.5981308411214953,
+      "eval_loss": 0.6646633744239807,
+      "eval_runtime": 1.8769,
+      "eval_samples_per_second": 57.008,
+      "eval_steps_per_second": 3.729,
       "step": 200
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.5794392523364486,
+      "eval_loss": 0.6761506199836731,
+      "eval_runtime": 1.8489,
+      "eval_samples_per_second": 57.871,
+      "eval_steps_per_second": 3.786,
       "step": 208
     },
     {
       "epoch": 26.25,
+      "learning_rate": 1.5277777777777777e-05,
+      "loss": 0.6675,
       "step": 210
     },
     {
       "epoch": 27.0,
+      "eval_accuracy": 0.5700934579439252,
+      "eval_loss": 0.659662127494812,
+      "eval_runtime": 1.8699,
+      "eval_samples_per_second": 57.221,
+      "eval_steps_per_second": 3.743,
       "step": 216
     },
     {
       "epoch": 27.5,
+      "learning_rate": 1.388888888888889e-05,
+      "loss": 0.6628,
       "step": 220
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.6355140186915887,
+      "eval_loss": 0.6563044190406799,
+      "eval_runtime": 1.901,
+      "eval_samples_per_second": 56.288,
+      "eval_steps_per_second": 3.682,
       "step": 224
     },
     {
       "epoch": 28.75,
+      "learning_rate": 1.25e-05,
+      "loss": 0.6478,
       "step": 230
     },
     {
       "epoch": 29.0,
+      "eval_accuracy": 0.5794392523364486,
+      "eval_loss": 0.6790612936019897,
+      "eval_runtime": 1.8634,
+      "eval_samples_per_second": 57.421,
+      "eval_steps_per_second": 3.757,
       "step": 232
     },
     {
       "epoch": 30.0,
+      "learning_rate": 1.1111111111111113e-05,
+      "loss": 0.6642,
       "step": 240
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6573609709739685,
+      "eval_runtime": 1.884,
+      "eval_samples_per_second": 56.796,
+      "eval_steps_per_second": 3.716,
       "step": 240
     },
     {
       "epoch": 31.0,
+      "eval_accuracy": 0.5607476635514018,
+      "eval_loss": 0.6556074023246765,
+      "eval_runtime": 1.872,
+      "eval_samples_per_second": 57.159,
+      "eval_steps_per_second": 3.739,
       "step": 248
     },
     {
       "epoch": 31.25,
+      "learning_rate": 9.722222222222223e-06,
+      "loss": 0.654,
       "step": 250
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.5887850467289719,
+      "eval_loss": 0.6523457169532776,
+      "eval_runtime": 1.871,
+      "eval_samples_per_second": 57.19,
+      "eval_steps_per_second": 3.741,
       "step": 256
     },
     {
       "epoch": 32.5,
+      "learning_rate": 8.333333333333334e-06,
+      "loss": 0.6602,
       "step": 260
     },
     {
       "epoch": 33.0,
+      "eval_accuracy": 0.6261682242990654,
+      "eval_loss": 0.6463862657546997,
+      "eval_runtime": 1.8604,
+      "eval_samples_per_second": 57.513,
+      "eval_steps_per_second": 3.763,
       "step": 264
     },
     {
       "epoch": 33.75,
+      "learning_rate": 6.944444444444445e-06,
+      "loss": 0.6535,
       "step": 270
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.616822429906542,
+      "eval_loss": 0.6450387835502625,
+      "eval_runtime": 2.0415,
+      "eval_samples_per_second": 52.413,
+      "eval_steps_per_second": 3.429,
       "step": 272
     },
     {
       "epoch": 35.0,
+      "learning_rate": 5.555555555555557e-06,
+      "loss": 0.6506,
       "step": 280
     },
     {
       "epoch": 35.0,
+      "eval_accuracy": 0.5794392523364486,
+      "eval_loss": 0.6549742221832275,
+      "eval_runtime": 1.8524,
+      "eval_samples_per_second": 57.762,
+      "eval_steps_per_second": 3.779,
       "step": 280
     },
     {
       "epoch": 36.0,
+      "eval_accuracy": 0.6074766355140186,
+      "eval_loss": 0.6437696218490601,
+      "eval_runtime": 1.837,
+      "eval_samples_per_second": 58.249,
+      "eval_steps_per_second": 3.811,
       "step": 288
     },
     {
       "epoch": 36.25,
+      "learning_rate": 4.166666666666667e-06,
+      "loss": 0.6533,
       "step": 290
     },
     {
       "epoch": 37.0,
+      "eval_accuracy": 0.6822429906542056,
+      "eval_loss": 0.6395505666732788,
+      "eval_runtime": 1.8519,
+      "eval_samples_per_second": 57.777,
+      "eval_steps_per_second": 3.78,
       "step": 296
     },
     {
       "epoch": 37.5,
+      "learning_rate": 2.7777777777777783e-06,
+      "loss": 0.6443,
       "step": 300
     },
     {
       "epoch": 38.0,
+      "eval_accuracy": 0.6635514018691588,
+      "eval_loss": 0.6383424997329712,
+      "eval_runtime": 1.8994,
+      "eval_samples_per_second": 56.332,
+      "eval_steps_per_second": 3.685,
       "step": 304
     },
     {
       "epoch": 38.75,
+      "learning_rate": 1.3888888888888892e-06,
+      "loss": 0.6263,
       "step": 310
     },
     {
       "epoch": 39.0,
+      "eval_accuracy": 0.6448598130841121,
+      "eval_loss": 0.6377760171890259,
+      "eval_runtime": 1.8969,
+      "eval_samples_per_second": 56.406,
+      "eval_steps_per_second": 3.69,
       "step": 312
     },
     {
       "epoch": 40.0,
       "learning_rate": 0.0,
+      "loss": 0.6283,
       "step": 320
     },
     {
       "epoch": 40.0,
+      "eval_accuracy": 0.6448598130841121,
+      "eval_loss": 0.6378776431083679,
+      "eval_runtime": 1.8389,
+      "eval_samples_per_second": 58.186,
+      "eval_steps_per_second": 3.807,
       "step": 320
     },
     {
       "epoch": 40.0,
       "step": 320,
       "total_flos": 6.480838238876467e+17,
+      "train_loss": 1.1531404286623002,
+      "train_runtime": 569.0029,
+      "train_samples_per_second": 35.009,
+      "train_steps_per_second": 0.562
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1eb3ae6da4bd4826a72ebe0f4e937ad3b5d737b9c90b89682ccd8f7234d78ea3
 size 4728

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b7e74dff4ca6ca6685230bb17bfaae8471c3a7c204cf2ade59db4ef7c494d01
 size 4728