End of training

Browse files

Files changed (6) hide show

README.md +2 -2
all_results.json +11 -11
eval_results.json +6 -6
runs/Jan13_19-54-30_a732f801c5be/events.out.tfevents.1705177969.a732f801c5be.827.6 +3 -0
train_results.json +6 -6
trainer_state.json +158 -341

README.md CHANGED Viewed

@@ -17,8 +17,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/resnet-101](https://huggingface.co/microsoft/resnet-101) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.6683
-- Accuracy: 0.7676
 ## Model description

 This model is a fine-tuned version of [microsoft/resnet-101](https://huggingface.co/microsoft/resnet-101) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.6763
+- Accuracy: 0.7701
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 4.94,
-    "eval_accuracy": 0.7436274509803922,
-    "eval_loss": 0.831763505935669,
-    "eval_runtime": 25.9823,
-    "eval_samples_per_second": 78.515,
-    "eval_steps_per_second": 2.463,
-    "total_flos": 1.5485654902849044e+18,
-    "train_loss": 1.3921774001348586,
-    "train_runtime": 1093.5355,
-    "train_samples_per_second": 37.306,
-    "train_steps_per_second": 0.288
 }

 {
+    "epoch": 9.8,
+    "eval_accuracy": 0.7700980392156863,
+    "eval_loss": 0.6762834191322327,
+    "eval_runtime": 27.2812,
+    "eval_samples_per_second": 74.777,
+    "eval_steps_per_second": 2.346,
+    "total_flos": 3.072509726495183e+18,
+    "train_loss": 1.3191132202148437,
+    "train_runtime": 2261.7516,
+    "train_samples_per_second": 36.074,
+    "train_steps_per_second": 0.111
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 4.94,
-    "eval_accuracy": 0.7436274509803922,
-    "eval_loss": 0.831763505935669,
-    "eval_runtime": 25.9823,
-    "eval_samples_per_second": 78.515,
-    "eval_steps_per_second": 2.463
 }

 {
+    "epoch": 9.8,
+    "eval_accuracy": 0.7700980392156863,
+    "eval_loss": 0.6762834191322327,
+    "eval_runtime": 27.2812,
+    "eval_samples_per_second": 74.777,
+    "eval_steps_per_second": 2.346
 }

runs/Jan13_19-54-30_a732f801c5be/events.out.tfevents.1705177969.a732f801c5be.827.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ebd8aaffa626a56c6d41efef37fe5ae608ebdc9d39b31f5edd35f950ed4c1527
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 4.94,
-    "total_flos": 1.5485654902849044e+18,
-    "train_loss": 1.3921774001348586,
-    "train_runtime": 1093.5355,
-    "train_samples_per_second": 37.306,
-    "train_steps_per_second": 0.288
 }

 {
+    "epoch": 9.8,
+    "total_flos": 3.072509726495183e+18,
+    "train_loss": 1.3191132202148437,
+    "train_runtime": 2261.7516,
+    "train_samples_per_second": 36.074,
+    "train_steps_per_second": 0.111
 }

trainer_state.json CHANGED Viewed

@@ -1,451 +1,268 @@
 {
-  "best_metric": 0.7436274509803922,
-  "best_model_checkpoint": "resnet-101-finetuned-CivilEng11k/checkpoint-315",
-  "epoch": 4.9411764705882355,
   "eval_steps": 500,
-  "global_step": 315,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.08,
-      "learning_rate": 1.5625e-05,
-      "loss": 2.619,
-      "step": 5
-    },
-    {
-      "epoch": 0.16,
-      "learning_rate": 3.125e-05,
-      "loss": 2.6155,
       "step": 10
     },
     {
-      "epoch": 0.24,
-      "learning_rate": 4.6875e-05,
-      "loss": 2.5999,
-      "step": 15
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 6.25e-05,
-      "loss": 2.577,
       "step": 20
     },
     {
-      "epoch": 0.39,
-      "learning_rate": 7.8125e-05,
-      "loss": 2.5468,
       "step": 25
     },
     {
-      "epoch": 0.47,
-      "learning_rate": 9.375e-05,
-      "loss": 2.5146,
       "step": 30
     },
     {
-      "epoch": 0.55,
-      "learning_rate": 9.893992932862192e-05,
-      "loss": 2.4682,
-      "step": 35
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 9.71731448763251e-05,
-      "loss": 2.4167,
       "step": 40
     },
     {
-      "epoch": 0.71,
-      "learning_rate": 9.540636042402827e-05,
-      "loss": 2.3337,
-      "step": 45
-    },
-    {
-      "epoch": 0.78,
-      "learning_rate": 9.363957597173145e-05,
-      "loss": 2.2503,
       "step": 50
     },
     {
-      "epoch": 0.86,
-      "learning_rate": 9.187279151943463e-05,
-      "loss": 2.1624,
-      "step": 55
     },
     {
-      "epoch": 0.94,
-      "learning_rate": 9.01060070671378e-05,
-      "loss": 2.0986,
       "step": 60
     },
     {
-      "epoch": 0.99,
-      "eval_accuracy": 0.5431372549019607,
-      "eval_loss": 1.9500516653060913,
-      "eval_runtime": 32.3617,
-      "eval_samples_per_second": 63.037,
-      "eval_steps_per_second": 1.978,
-      "step": 63
-    },
-    {
-      "epoch": 1.02,
-      "learning_rate": 8.833922261484099e-05,
-      "loss": 1.9785,
-      "step": 65
-    },
-    {
-      "epoch": 1.1,
-      "learning_rate": 8.657243816254418e-05,
-      "loss": 1.8484,
       "step": 70
     },
     {
-      "epoch": 1.18,
-      "learning_rate": 8.480565371024736e-05,
-      "loss": 1.7483,
-      "step": 75
     },
     {
-      "epoch": 1.25,
-      "learning_rate": 8.303886925795053e-05,
-      "loss": 1.6201,
       "step": 80
     },
     {
-      "epoch": 1.33,
-      "learning_rate": 8.127208480565371e-05,
-      "loss": 1.5606,
-      "step": 85
-    },
-    {
-      "epoch": 1.41,
-      "learning_rate": 7.95053003533569e-05,
-      "loss": 1.4728,
       "step": 90
     },
     {
-      "epoch": 1.49,
-      "learning_rate": 7.773851590106007e-05,
-      "loss": 1.5132,
-      "step": 95
-    },
-    {
-      "epoch": 1.57,
-      "learning_rate": 7.597173144876325e-05,
-      "loss": 1.4121,
       "step": 100
     },
     {
-      "epoch": 1.65,
-      "learning_rate": 7.420494699646644e-05,
-      "loss": 1.4417,
-      "step": 105
     },
     {
-      "epoch": 1.73,
-      "learning_rate": 7.243816254416963e-05,
-      "loss": 1.4318,
       "step": 110
     },
     {
-      "epoch": 1.8,
-      "learning_rate": 7.06713780918728e-05,
-      "loss": 1.3735,
-      "step": 115
-    },
-    {
-      "epoch": 1.88,
-      "learning_rate": 6.890459363957598e-05,
-      "loss": 1.3202,
       "step": 120
     },
     {
-      "epoch": 1.96,
-      "learning_rate": 6.713780918727916e-05,
-      "loss": 1.299,
-      "step": 125
-    },
-    {
-      "epoch": 1.99,
-      "eval_accuracy": 0.5779411764705882,
-      "eval_loss": 1.253934621810913,
-      "eval_runtime": 35.8869,
-      "eval_samples_per_second": 56.845,
-      "eval_steps_per_second": 1.783,
       "step": 127
     },
     {
-      "epoch": 2.04,
-      "learning_rate": 6.537102473498233e-05,
-      "loss": 1.2606,
       "step": 130
     },
     {
-      "epoch": 2.12,
-      "learning_rate": 6.360424028268551e-05,
-      "loss": 1.2339,
-      "step": 135
-    },
-    {
-      "epoch": 2.2,
-      "learning_rate": 6.183745583038869e-05,
-      "loss": 1.2239,
       "step": 140
     },
     {
-      "epoch": 2.27,
-      "learning_rate": 6.007067137809188e-05,
-      "loss": 1.2909,
-      "step": 145
-    },
-    {
-      "epoch": 2.35,
-      "learning_rate": 5.830388692579506e-05,
-      "loss": 1.1971,
       "step": 150
     },
     {
-      "epoch": 2.43,
-      "learning_rate": 5.653710247349824e-05,
-      "loss": 1.1964,
-      "step": 155
     },
     {
-      "epoch": 2.51,
-      "learning_rate": 5.477031802120142e-05,
-      "loss": 1.1352,
       "step": 160
     },
     {
-      "epoch": 2.59,
-      "learning_rate": 5.3003533568904595e-05,
-      "loss": 1.1566,
-      "step": 165
-    },
-    {
-      "epoch": 2.67,
-      "learning_rate": 5.123674911660777e-05,
-      "loss": 1.1064,
       "step": 170
     },
     {
-      "epoch": 2.75,
-      "learning_rate": 4.946996466431096e-05,
-      "loss": 1.0537,
-      "step": 175
     },
     {
-      "epoch": 2.82,
-      "learning_rate": 4.7703180212014135e-05,
-      "loss": 1.0977,
       "step": 180
     },
     {
-      "epoch": 2.9,
-      "learning_rate": 4.593639575971732e-05,
-      "loss": 1.1238,
-      "step": 185
-    },
-    {
-      "epoch": 2.98,
-      "learning_rate": 4.416961130742049e-05,
-      "loss": 1.0809,
       "step": 190
     },
     {
-      "epoch": 3.0,
-      "eval_accuracy": 0.6622549019607843,
-      "eval_loss": 1.0138132572174072,
-      "eval_runtime": 38.0303,
-      "eval_samples_per_second": 53.641,
-      "eval_steps_per_second": 1.683,
-      "step": 191
-    },
-    {
-      "epoch": 3.06,
-      "learning_rate": 4.240282685512368e-05,
-      "loss": 0.9985,
-      "step": 195
-    },
-    {
-      "epoch": 3.14,
-      "learning_rate": 4.063604240282686e-05,
-      "loss": 1.0406,
       "step": 200
     },
     {
-      "epoch": 3.22,
-      "learning_rate": 3.886925795053003e-05,
-      "loss": 1.0754,
-      "step": 205
     },
     {
-      "epoch": 3.29,
-      "learning_rate": 3.710247349823322e-05,
-      "loss": 0.9488,
       "step": 210
     },
     {
-      "epoch": 3.37,
-      "learning_rate": 3.53356890459364e-05,
-      "loss": 1.0375,
-      "step": 215
-    },
-    {
-      "epoch": 3.45,
-      "learning_rate": 3.356890459363958e-05,
-      "loss": 0.9941,
       "step": 220
     },
     {
-      "epoch": 3.53,
-      "learning_rate": 3.1802120141342755e-05,
-      "loss": 0.8968,
-      "step": 225
     },
     {
-      "epoch": 3.61,
-      "learning_rate": 3.003533568904594e-05,
-      "loss": 0.9441,
       "step": 230
     },
     {
-      "epoch": 3.69,
-      "learning_rate": 2.826855123674912e-05,
-      "loss": 1.0055,
-      "step": 235
-    },
-    {
-      "epoch": 3.76,
-      "learning_rate": 2.6501766784452298e-05,
-      "loss": 0.9585,
       "step": 240
     },
     {
-      "epoch": 3.84,
-      "learning_rate": 2.473498233215548e-05,
-      "loss": 0.9804,
-      "step": 245
-    },
-    {
-      "epoch": 3.92,
-      "learning_rate": 2.296819787985866e-05,
-      "loss": 0.9441,
       "step": 250
     },
     {
-      "epoch": 4.0,
-      "learning_rate": 2.120141342756184e-05,
-      "loss": 0.9495,
-      "step": 255
-    },
-    {
-      "epoch": 4.0,
-      "eval_accuracy": 0.7318627450980392,
-      "eval_loss": 0.8730877041816711,
-      "eval_runtime": 38.4534,
-      "eval_samples_per_second": 53.051,
-      "eval_steps_per_second": 1.664,
-      "step": 255
-    },
-    {
-      "epoch": 4.08,
-      "learning_rate": 1.9434628975265016e-05,
-      "loss": 0.9134,
-      "step": 260
-    },
-    {
-      "epoch": 4.16,
-      "learning_rate": 1.76678445229682e-05,
-      "loss": 0.8873,
-      "step": 265
-    },
-    {
-      "epoch": 4.24,
-      "learning_rate": 1.5901060070671377e-05,
-      "loss": 0.898,
-      "step": 270
-    },
-    {
-      "epoch": 4.31,
-      "learning_rate": 1.413427561837456e-05,
-      "loss": 0.8586,
-      "step": 275
-    },
-    {
-      "epoch": 4.39,
-      "learning_rate": 1.236749116607774e-05,
-      "loss": 0.8358,
-      "step": 280
-    },
-    {
-      "epoch": 4.47,
-      "learning_rate": 1.060070671378092e-05,
-      "loss": 0.9083,
-      "step": 285
-    },
-    {
-      "epoch": 4.55,
-      "learning_rate": 8.8339222614841e-06,
-      "loss": 0.9129,
-      "step": 290
-    },
-    {
-      "epoch": 4.63,
-      "learning_rate": 7.06713780918728e-06,
-      "loss": 0.8401,
-      "step": 295
-    },
-    {
-      "epoch": 4.71,
-      "learning_rate": 5.30035335689046e-06,
-      "loss": 0.9357,
-      "step": 300
-    },
-    {
-      "epoch": 4.78,
-      "learning_rate": 3.53356890459364e-06,
-      "loss": 0.82,
-      "step": 305
-    },
-    {
-      "epoch": 4.86,
-      "learning_rate": 1.76678445229682e-06,
-      "loss": 0.9039,
-      "step": 310
     },
     {
-      "epoch": 4.94,
-      "learning_rate": 0.0,
-      "loss": 0.8398,
-      "step": 315
-    },
-    {
-      "epoch": 4.94,
-      "eval_accuracy": 0.7436274509803922,
-      "eval_loss": 0.831763505935669,
-      "eval_runtime": 39.256,
-      "eval_samples_per_second": 51.967,
-      "eval_steps_per_second": 1.63,
-      "step": 315
-    },
-    {
-      "epoch": 4.94,
-      "step": 315,
-      "total_flos": 1.5485654902849044e+18,
-      "train_loss": 1.3921774001348586,
-      "train_runtime": 1093.5355,
-      "train_samples_per_second": 37.306,
-      "train_steps_per_second": 0.288
     }
   ],
-  "logging_steps": 5,
-  "max_steps": 315,
-  "num_train_epochs": 5,
   "save_steps": 500,
-  "total_flos": 1.5485654902849044e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.7700980392156863,
+  "best_model_checkpoint": "resnet-101-finetuned-CivilEng11k/checkpoint-229",
+  "epoch": 9.803921568627452,
   "eval_steps": 500,
+  "global_step": 250,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.39,
+      "learning_rate": 4e-05,
+      "loss": 2.6157,
       "step": 10
     },
     {
+      "epoch": 0.78,
+      "learning_rate": 8e-05,
+      "loss": 2.5769,
       "step": 20
     },
     {
+      "epoch": 0.98,
+      "eval_accuracy": 0.5269607843137255,
+      "eval_loss": 2.49281907081604,
+      "eval_runtime": 40.5904,
+      "eval_samples_per_second": 50.258,
+      "eval_steps_per_second": 1.577,
       "step": 25
     },
     {
+      "epoch": 1.18,
+      "learning_rate": 9.777777777777778e-05,
+      "loss": 2.4933,
       "step": 30
     },
     {
+      "epoch": 1.57,
+      "learning_rate": 9.333333333333334e-05,
+      "loss": 2.3726,
       "step": 40
     },
     {
+      "epoch": 1.96,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 2.2271,
       "step": 50
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.5284313725490196,
+      "eval_loss": 2.184375047683716,
+      "eval_runtime": 41.3607,
+      "eval_samples_per_second": 49.322,
+      "eval_steps_per_second": 1.547,
+      "step": 51
     },
     {
+      "epoch": 2.35,
+      "learning_rate": 8.444444444444444e-05,
+      "loss": 2.004,
       "step": 60
     },
     {
+      "epoch": 2.75,
+      "learning_rate": 8e-05,
+      "loss": 1.6261,
       "step": 70
     },
     {
+      "epoch": 2.98,
+      "eval_accuracy": 0.5269607843137255,
+      "eval_loss": 1.4098289012908936,
+      "eval_runtime": 40.6734,
+      "eval_samples_per_second": 50.156,
+      "eval_steps_per_second": 1.574,
+      "step": 76
     },
     {
+      "epoch": 3.14,
+      "learning_rate": 7.555555555555556e-05,
+      "loss": 1.4818,
       "step": 80
     },
     {
+      "epoch": 3.53,
+      "learning_rate": 7.111111111111112e-05,
+      "loss": 1.3531,
       "step": 90
     },
     {
+      "epoch": 3.92,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 1.2715,
       "step": 100
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.5799019607843138,
+      "eval_loss": 1.204033613204956,
+      "eval_runtime": 41.3797,
+      "eval_samples_per_second": 49.3,
+      "eval_steps_per_second": 1.547,
+      "step": 102
     },
     {
+      "epoch": 4.31,
+      "learning_rate": 6.222222222222222e-05,
+      "loss": 1.1843,
       "step": 110
     },
     {
+      "epoch": 4.71,
+      "learning_rate": 5.7777777777777776e-05,
+      "loss": 1.1368,
       "step": 120
     },
     {
+      "epoch": 4.98,
+      "eval_accuracy": 0.6852941176470588,
+      "eval_loss": 1.0043939352035522,
+      "eval_runtime": 40.9737,
+      "eval_samples_per_second": 49.788,
+      "eval_steps_per_second": 1.562,
       "step": 127
     },
     {
+      "epoch": 5.1,
+      "learning_rate": 5.333333333333333e-05,
+      "loss": 1.0742,
       "step": 130
     },
     {
+      "epoch": 5.49,
+      "learning_rate": 4.888888888888889e-05,
+      "loss": 0.9825,
       "step": 140
     },
     {
+      "epoch": 5.88,
+      "learning_rate": 4.4444444444444447e-05,
+      "loss": 0.9366,
       "step": 150
     },
     {
+      "epoch": 6.0,
+      "eval_accuracy": 0.7455882352941177,
+      "eval_loss": 0.8462627530097961,
+      "eval_runtime": 40.2496,
+      "eval_samples_per_second": 50.684,
+      "eval_steps_per_second": 1.59,
+      "step": 153
     },
     {
+      "epoch": 6.27,
+      "learning_rate": 4e-05,
+      "loss": 0.899,
       "step": 160
     },
     {
+      "epoch": 6.67,
+      "learning_rate": 3.555555555555556e-05,
+      "loss": 0.8249,
       "step": 170
     },
     {
+      "epoch": 6.98,
+      "eval_accuracy": 0.7686274509803922,
+      "eval_loss": 0.7511501908302307,
+      "eval_runtime": 47.4571,
+      "eval_samples_per_second": 42.986,
+      "eval_steps_per_second": 1.349,
+      "step": 178
     },
     {
+      "epoch": 7.06,
+      "learning_rate": 3.111111111111111e-05,
+      "loss": 0.8197,
       "step": 180
     },
     {
+      "epoch": 7.45,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 0.7562,
       "step": 190
     },
     {
+      "epoch": 7.84,
+      "learning_rate": 2.2222222222222223e-05,
+      "loss": 0.7635,
       "step": 200
     },
     {
+      "epoch": 8.0,
+      "eval_accuracy": 0.7612745098039215,
+      "eval_loss": 0.7078944444656372,
+      "eval_runtime": 40.9903,
+      "eval_samples_per_second": 49.768,
+      "eval_steps_per_second": 1.561,
+      "step": 204
     },
     {
+      "epoch": 8.24,
+      "learning_rate": 1.777777777777778e-05,
+      "loss": 0.7415,
       "step": 210
     },
     {
+      "epoch": 8.63,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 0.7213,
       "step": 220
     },
     {
+      "epoch": 8.98,
+      "eval_accuracy": 0.7700980392156863,
+      "eval_loss": 0.6762834191322327,
+      "eval_runtime": 40.8595,
+      "eval_samples_per_second": 49.927,
+      "eval_steps_per_second": 1.566,
+      "step": 229
     },
     {
+      "epoch": 9.02,
+      "learning_rate": 8.88888888888889e-06,
+      "loss": 0.6951,
       "step": 230
     },
     {
+      "epoch": 9.41,
+      "learning_rate": 4.444444444444445e-06,
+      "loss": 0.7295,
       "step": 240
     },
     {
+      "epoch": 9.8,
+      "learning_rate": 0.0,
+      "loss": 0.6905,
       "step": 250
     },
     {
+      "epoch": 9.8,
+      "eval_accuracy": 0.7676470588235295,
+      "eval_loss": 0.6683045625686646,
+      "eval_runtime": 39.5198,
+      "eval_samples_per_second": 51.62,
+      "eval_steps_per_second": 1.619,
+      "step": 250
     },
     {
+      "epoch": 9.8,
+      "step": 250,
+      "total_flos": 3.072509726495183e+18,
+      "train_loss": 1.3191132202148437,
+      "train_runtime": 2261.7516,
+      "train_samples_per_second": 36.074,
+      "train_steps_per_second": 0.111
     }
   ],
+  "logging_steps": 10,
+  "max_steps": 250,
+  "num_train_epochs": 10,
   "save_steps": 500,
+  "total_flos": 3.072509726495183e+18,
   "trial_name": null,
   "trial_params": null
 }