mjphayes/vit-elpv-augmented

Browse files

Files changed (8) hide show

README.md +21 -17
all_results.json +6 -5
config.json +1 -1
model.safetensors +1 -1
runs/Nov16_09-36-14_nk7ic4m731/events.out.tfevents.1700127380.nk7ic4m731.228.0 +3 -0
train_results.json +6 -5
trainer_state.json +117 -249
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7721
-- Accuracy: 0.6929
 ## Model description
@@ -46,27 +46,31 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 10
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 1.0   | 69   | 1.0376          | 0.5939   |
-| No log        | 2.0   | 138  | 0.9578          | 0.5914   |
-| No log        | 3.0   | 207  | 0.9083          | 0.6447   |
-| No log        | 4.0   | 276  | 0.8320          | 0.6751   |
-| No log        | 5.0   | 345  | 0.8832          | 0.6371   |
-| No log        | 6.0   | 414  | 0.8498          | 0.6574   |
-| No log        | 7.0   | 483  | 0.8124          | 0.6701   |
-| 0.7809        | 8.0   | 552  | 0.8627          | 0.6701   |
-| 0.7809        | 9.0   | 621  | 0.8003          | 0.6701   |
-| 0.7809        | 10.0  | 690  | 0.7721          | 0.6929   |
 ### Framework versions
-- Transformers 4.35.0
-- Pytorch 2.1.0
-- Datasets 2.14.6
-- Tokenizers 0.14.1

 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7687
+- Accuracy: 0.7259
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 14
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Accuracy |
 |:-------------:|:-----:|:----:|:---------------:|:--------:|
+| No log        | 1.0   | 69   | 1.1146          | 0.5787   |
+| No log        | 2.0   | 138  | 0.9812          | 0.5787   |
+| No log        | 3.0   | 207  | 0.8885          | 0.6472   |
+| No log        | 4.0   | 276  | 0.7930          | 0.7081   |
+| No log        | 5.0   | 345  | 0.8019          | 0.6929   |
+| No log        | 6.0   | 414  | 0.8009          | 0.6878   |
+| No log        | 7.0   | 483  | 0.7984          | 0.6853   |
+| 0.8194        | 8.0   | 552  | 0.7714          | 0.7107   |
+| 0.8194        | 9.0   | 621  | 0.7667          | 0.7081   |
+| 0.8194        | 10.0  | 690  | 0.7303          | 0.7234   |
+| 0.8194        | 11.0  | 759  | 0.7321          | 0.7284   |
+| 0.8194        | 12.0  | 828  | 0.7373          | 0.7335   |
+| 0.8194        | 13.0  | 897  | 0.8051          | 0.6904   |
+| 0.8194        | 14.0  | 966  | 0.7687          | 0.7259   |
 ### Framework versions
+- Transformers 4.35.2
+- Pytorch 2.1.1+cu121
+- Datasets 2.15.0
+- Tokenizers 0.15.0

all_results.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
-    "epoch": 10.0,
-    "train_loss": 0.7178522997889025,
-    "train_runtime": 2833.88,
-    "train_samples_per_second": 6.514,
-    "train_steps_per_second": 0.102
 }

 {
+    "epoch": 14.0,
+    "total_flos": 4.790950643943604e+18,
+    "train_loss": 0.63200661163646,
+    "train_runtime": 1457.5958,
+    "train_samples_per_second": 42.415,
+    "train_steps_per_second": 0.663
 }

config.json CHANGED Viewed

@@ -32,5 +32,5 @@
   "problem_type": "single_label_classification",
   "qkv_bias": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.35.0"
 }

   "problem_type": "single_label_classification",
   "qkv_bias": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.35.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b82d916b8466c58a9e22666cb75066ac16bfe1547114c247120c5dcf6d4a7f83
 size 343230128

 version https://git-lfs.github.com/spec/v1
+oid sha256:d29546920076aeb62358d5f3b4a15298c89fc5581b645c9cb4015ab1832aeedd
 size 343230128

runs/Nov16_09-36-14_nk7ic4m731/events.out.tfevents.1700127380.nk7ic4m731.228.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:328f29abe32d555dc51c43e7580c4157a946ef8373f06e5e3f38e381640c3278
+size 9262

train_results.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
-    "epoch": 10.0,
-    "train_loss": 0.7178522997889025,
-    "train_runtime": 2833.88,
-    "train_samples_per_second": 6.514,
-    "train_steps_per_second": 0.102
 }

 {
+    "epoch": 14.0,
+    "total_flos": 4.790950643943604e+18,
+    "train_loss": 0.63200661163646,
+    "train_runtime": 1457.5958,
+    "train_samples_per_second": 42.415,
+    "train_steps_per_second": 0.663
 }

trainer_state.json CHANGED Viewed

@@ -1,292 +1,160 @@
 {
-  "best_metric": 0.7518796992481203,
-  "best_model_checkpoint": "../results/elpv-vit/checkpoint-232",
-  "epoch": 10.0,
   "eval_steps": 500,
-  "global_step": 290,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
-    {
-      "epoch": 0.34,
-      "learning_rate": 1.7241379310344828e-05,
-      "loss": 1.3357,
-      "step": 10
-    },
-    {
-      "epoch": 0.69,
-      "learning_rate": 3.4482758620689657e-05,
-      "loss": 1.1598,
-      "step": 20
-    },
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6954887218045113,
-      "eval_loss": 0.9091870188713074,
-      "eval_runtime": 10.3022,
-      "eval_samples_per_second": 25.82,
-      "eval_steps_per_second": 1.65,
-      "step": 29
-    },
-    {
-      "epoch": 1.03,
-      "learning_rate": 4.980842911877395e-05,
-      "loss": 0.9746,
-      "step": 30
-    },
-    {
-      "epoch": 1.38,
-      "learning_rate": 4.789272030651341e-05,
-      "loss": 0.8597,
-      "step": 40
-    },
-    {
-      "epoch": 1.72,
-      "learning_rate": 4.597701149425287e-05,
-      "loss": 0.8226,
-      "step": 50
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.7368421052631579,
-      "eval_loss": 0.7852613925933838,
-      "eval_runtime": 10.1106,
-      "eval_samples_per_second": 26.309,
-      "eval_steps_per_second": 1.681,
-      "step": 58
-    },
-    {
-      "epoch": 2.07,
-      "learning_rate": 4.406130268199234e-05,
-      "loss": 0.7585,
-      "step": 60
-    },
-    {
-      "epoch": 2.41,
-      "learning_rate": 4.21455938697318e-05,
-      "loss": 0.7611,
-      "step": 70
-    },
-    {
-      "epoch": 2.76,
-      "learning_rate": 4.0229885057471265e-05,
-      "loss": 0.6841,
-      "step": 80
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.7180451127819549,
-      "eval_loss": 0.811350405216217,
-      "eval_runtime": 13.3447,
-      "eval_samples_per_second": 19.933,
-      "eval_steps_per_second": 1.274,
-      "step": 87
-    },
-    {
-      "epoch": 3.1,
-      "learning_rate": 3.831417624521073e-05,
-      "loss": 0.7207,
-      "step": 90
-    },
-    {
-      "epoch": 3.45,
-      "learning_rate": 3.6398467432950195e-05,
-      "loss": 0.7422,
-      "step": 100
-    },
-    {
-      "epoch": 3.79,
-      "learning_rate": 3.4482758620689657e-05,
-      "loss": 0.73,
-      "step": 110
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7293233082706767,
-      "eval_loss": 0.7547905445098877,
-      "eval_runtime": 11.7612,
-      "eval_samples_per_second": 22.617,
-      "eval_steps_per_second": 1.445,
-      "step": 116
-    },
-    {
-      "epoch": 4.14,
-      "learning_rate": 3.256704980842912e-05,
-      "loss": 0.6787,
-      "step": 120
-    },
-    {
-      "epoch": 4.48,
-      "learning_rate": 3.065134099616858e-05,
-      "loss": 0.6738,
-      "step": 130
-    },
-    {
-      "epoch": 4.83,
-      "learning_rate": 2.8735632183908045e-05,
-      "loss": 0.6725,
-      "step": 140
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.7406015037593985,
-      "eval_loss": 0.75775146484375,
-      "eval_runtime": 12.9654,
-      "eval_samples_per_second": 20.516,
-      "eval_steps_per_second": 1.311,
-      "step": 145
-    },
-    {
-      "epoch": 5.17,
-      "learning_rate": 2.681992337164751e-05,
-      "loss": 0.6785,
-      "step": 150
-    },
-    {
-      "epoch": 5.52,
-      "learning_rate": 2.4904214559386975e-05,
-      "loss": 0.6259,
-      "step": 160
-    },
-    {
-      "epoch": 5.86,
-      "learning_rate": 2.2988505747126437e-05,
-      "loss": 0.6625,
-      "step": 170
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.7368421052631579,
-      "eval_loss": 0.732495129108429,
-      "eval_runtime": 14.6428,
-      "eval_samples_per_second": 18.166,
-      "eval_steps_per_second": 1.161,
-      "step": 174
-    },
-    {
-      "epoch": 6.21,
-      "learning_rate": 2.10727969348659e-05,
-      "loss": 0.6335,
-      "step": 180
-    },
-    {
-      "epoch": 6.55,
-      "learning_rate": 1.9157088122605367e-05,
-      "loss": 0.6216,
-      "step": 190
-    },
-    {
-      "epoch": 6.9,
-      "learning_rate": 1.7241379310344828e-05,
-      "loss": 0.6214,
-      "step": 200
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.7481203007518797,
-      "eval_loss": 0.6711514592170715,
-      "eval_runtime": 13.3792,
-      "eval_samples_per_second": 19.882,
-      "eval_steps_per_second": 1.271,
-      "step": 203
-    },
-    {
-      "epoch": 7.24,
-      "learning_rate": 1.532567049808429e-05,
-      "loss": 0.6385,
-      "step": 210
     },
     {
-      "epoch": 7.59,
-      "learning_rate": 1.3409961685823755e-05,
-      "loss": 0.6202,
-      "step": 220
-    },
-    {
-      "epoch": 7.93,
-      "learning_rate": 1.1494252873563218e-05,
-      "loss": 0.5911,
-      "step": 230
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.7518796992481203,
-      "eval_loss": 0.6812042593955994,
-      "eval_runtime": 14.3277,
-      "eval_samples_per_second": 18.565,
-      "eval_steps_per_second": 1.187,
-      "step": 232
-    },
-    {
-      "epoch": 8.28,
-      "learning_rate": 9.578544061302683e-06,
-      "loss": 0.5925,
-      "step": 240
-    },
-    {
-      "epoch": 8.62,
-      "learning_rate": 7.662835249042145e-06,
-      "loss": 0.5711,
-      "step": 250
-    },
-    {
-      "epoch": 8.97,
-      "learning_rate": 5.747126436781609e-06,
-      "loss": 0.6169,
-      "step": 260
     },
     {
       "epoch": 9.0,
-      "eval_accuracy": 0.7481203007518797,
-      "eval_loss": 0.7047642469406128,
-      "eval_runtime": 17.1552,
-      "eval_samples_per_second": 15.505,
-      "eval_steps_per_second": 0.991,
-      "step": 261
-    },
-    {
-      "epoch": 9.31,
-      "learning_rate": 3.8314176245210725e-06,
-      "loss": 0.6163,
-      "step": 270
-    },
-    {
-      "epoch": 9.66,
-      "learning_rate": 1.9157088122605362e-06,
-      "loss": 0.5672,
-      "step": 280
-    },
-    {
-      "epoch": 10.0,
-      "learning_rate": 0.0,
-      "loss": 0.5863,
-      "step": 290
-    },
-    {
-      "epoch": 10.0,
-      "eval_accuracy": 0.7406015037593985,
-      "eval_loss": 0.7278200387954712,
-      "eval_runtime": 12.3926,
-      "eval_samples_per_second": 21.464,
-      "eval_steps_per_second": 1.372,
-      "step": 290
     },
     {
       "epoch": 10.0,
-      "step": 290,
-      "total_flos": 1.430527770561577e+18,
-      "train_loss": 0.7178522997889025,
-      "train_runtime": 2833.88,
-      "train_samples_per_second": 6.514,
-      "train_steps_per_second": 0.102
     }
   ],
-  "logging_steps": 10,
-  "max_steps": 290,
-  "num_train_epochs": 10,
   "save_steps": 500,
-  "total_flos": 1.430527770561577e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.733502538071066,
+  "best_model_checkpoint": "../results/elpv-vit/checkpoint-828",
+  "epoch": 14.0,
   "eval_steps": 500,
+  "global_step": 966,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.5786802030456852,
+      "eval_loss": 1.1146228313446045,
+      "eval_runtime": 15.1595,
+      "eval_samples_per_second": 25.99,
+      "eval_steps_per_second": 1.649,
+      "step": 69
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.5786802030456852,
+      "eval_loss": 0.9812496304512024,
+      "eval_runtime": 4.4653,
+      "eval_samples_per_second": 88.237,
+      "eval_steps_per_second": 5.599,
+      "step": 138
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.6472081218274112,
+      "eval_loss": 0.8884502053260803,
+      "eval_runtime": 2.1388,
+      "eval_samples_per_second": 184.219,
+      "eval_steps_per_second": 11.689,
+      "step": 207
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.7081218274111675,
+      "eval_loss": 0.7930060625076294,
+      "eval_runtime": 2.1153,
+      "eval_samples_per_second": 186.265,
+      "eval_steps_per_second": 11.819,
+      "step": 276
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.6928934010152284,
+      "eval_loss": 0.8019062280654907,
+      "eval_runtime": 7.7818,
+      "eval_samples_per_second": 50.631,
+      "eval_steps_per_second": 3.213,
+      "step": 345
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.6878172588832487,
+      "eval_loss": 0.8009192943572998,
+      "eval_runtime": 2.0611,
+      "eval_samples_per_second": 191.162,
+      "eval_steps_per_second": 12.13,
+      "step": 414
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.6852791878172588,
+      "eval_loss": 0.7984281182289124,
+      "eval_runtime": 12.8592,
+      "eval_samples_per_second": 30.639,
+      "eval_steps_per_second": 1.944,
+      "step": 483
     },
     {
+      "epoch": 7.25,
+      "learning_rate": 2.6812428078250863e-05,
+      "loss": 0.8194,
+      "step": 500
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.7106598984771574,
+      "eval_loss": 0.7714311480522156,
+      "eval_runtime": 2.123,
+      "eval_samples_per_second": 185.586,
+      "eval_steps_per_second": 11.776,
+      "step": 552
     },
     {
       "epoch": 9.0,
+      "eval_accuracy": 0.7081218274111675,
+      "eval_loss": 0.7666618824005127,
+      "eval_runtime": 2.021,
+      "eval_samples_per_second": 194.952,
+      "eval_steps_per_second": 12.37,
+      "step": 621
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.7233502538071066,
+      "eval_loss": 0.7302789688110352,
+      "eval_runtime": 14.4927,
+      "eval_samples_per_second": 27.186,
+      "eval_steps_per_second": 1.725,
+      "step": 690
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.7284263959390863,
+      "eval_loss": 0.7321494817733765,
+      "eval_runtime": 2.2455,
+      "eval_samples_per_second": 175.465,
+      "eval_steps_per_second": 11.134,
+      "step": 759
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.733502538071066,
+      "eval_loss": 0.7373437285423279,
+      "eval_runtime": 5.5421,
+      "eval_samples_per_second": 71.092,
+      "eval_steps_per_second": 4.511,
+      "step": 828
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.6903553299492385,
+      "eval_loss": 0.8051439523696899,
+      "eval_runtime": 12.7177,
+      "eval_samples_per_second": 30.98,
+      "eval_steps_per_second": 1.966,
+      "step": 897
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.7258883248730964,
+      "eval_loss": 0.7687421441078186,
+      "eval_runtime": 4.2192,
+      "eval_samples_per_second": 93.382,
+      "eval_steps_per_second": 5.925,
+      "step": 966
+    },
+    {
+      "epoch": 14.0,
+      "step": 966,
+      "total_flos": 4.790950643943604e+18,
+      "train_loss": 0.63200661163646,
+      "train_runtime": 1457.5958,
+      "train_samples_per_second": 42.415,
+      "train_steps_per_second": 0.663
     }
   ],
+  "logging_steps": 500,
+  "max_steps": 966,
+  "num_train_epochs": 14,
   "save_steps": 500,
+  "total_flos": 4.790950643943604e+18,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:321bf62f0bb828ae9b9a88c70aa7a7f83bb62da583e16d3a70442dd7fa6e30ef
-size 4536

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec40bcb32560657f17298036bfeeb617bf1339373552d659c9a5924eb30b7635
+size 4600