End of training

Browse files

Files changed (6) hide show

README.md +2 -2
all_results.json +13 -0
eval_results.json +8 -0
runs/Feb10_03-10-33_e3629502e642/events.out.tfevents.1739157715.e3629502e642.73729.1 +3 -0
train_results.json +8 -0
trainer_state.json +552 -0

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.0401
-- Accuracy: 0.6731
 ## Model description

 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8727
+- Accuracy: 0.7308
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 44.8421052631579,
+    "eval_accuracy": 0.7307692307692307,
+    "eval_loss": 0.8727236390113831,
+    "eval_runtime": 0.9037,
+    "eval_samples_per_second": 57.54,
+    "eval_steps_per_second": 2.213,
+    "total_flos": 8.412779636714373e+17,
+    "train_loss": 0.527855412165324,
+    "train_runtime": 618.6977,
+    "train_samples_per_second": 44.076,
+    "train_steps_per_second": 0.291
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 44.8421052631579,
+    "eval_accuracy": 0.7307692307692307,
+    "eval_loss": 0.8727236390113831,
+    "eval_runtime": 0.9037,
+    "eval_samples_per_second": 57.54,
+    "eval_steps_per_second": 2.213
+}

runs/Feb10_03-10-33_e3629502e642/events.out.tfevents.1739157715.e3629502e642.73729.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eff5a3227ebf4ffcb0ccb726c67536265fcef3e5f1f50d0786a113bc1e562e00
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 44.8421052631579,
+    "total_flos": 8.412779636714373e+17,
+    "train_loss": 0.527855412165324,
+    "train_runtime": 618.6977,
+    "train_samples_per_second": 44.076,
+    "train_steps_per_second": 0.291
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,552 @@

+{
+  "best_metric": 0.7307692307692307,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-dmae-humeda-DAV57/checkpoint-96",
+  "epoch": 44.8421052631579,
+  "eval_steps": 500,
+  "global_step": 180,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.8421052631578947,
+      "eval_accuracy": 0.28846153846153844,
+      "eval_loss": 1.5806981325149536,
+      "eval_runtime": 0.8503,
+      "eval_samples_per_second": 61.156,
+      "eval_steps_per_second": 2.352,
+      "step": 4
+    },
+    {
+      "epoch": 1.8421052631578947,
+      "eval_accuracy": 0.4423076923076923,
+      "eval_loss": 1.4549280405044556,
+      "eval_runtime": 1.1721,
+      "eval_samples_per_second": 44.363,
+      "eval_steps_per_second": 1.706,
+      "step": 8
+    },
+    {
+      "epoch": 2.8421052631578947,
+      "grad_norm": 3.3740527629852295,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 1.6981,
+      "step": 12
+    },
+    {
+      "epoch": 2.8421052631578947,
+      "eval_accuracy": 0.4230769230769231,
+      "eval_loss": 1.3224066495895386,
+      "eval_runtime": 0.8125,
+      "eval_samples_per_second": 64.003,
+      "eval_steps_per_second": 2.462,
+      "step": 12
+    },
+    {
+      "epoch": 3.8421052631578947,
+      "eval_accuracy": 0.5,
+      "eval_loss": 1.207923412322998,
+      "eval_runtime": 0.8038,
+      "eval_samples_per_second": 64.69,
+      "eval_steps_per_second": 2.488,
+      "step": 16
+    },
+    {
+      "epoch": 4.842105263157895,
+      "eval_accuracy": 0.5769230769230769,
+      "eval_loss": 1.0541125535964966,
+      "eval_runtime": 0.834,
+      "eval_samples_per_second": 62.351,
+      "eval_steps_per_second": 2.398,
+      "step": 20
+    },
+    {
+      "epoch": 5.842105263157895,
+      "grad_norm": 9.979462623596191,
+      "learning_rate": 4.983095894354858e-05,
+      "loss": 1.2915,
+      "step": 24
+    },
+    {
+      "epoch": 5.842105263157895,
+      "eval_accuracy": 0.6346153846153846,
+      "eval_loss": 0.9398133158683777,
+      "eval_runtime": 0.8093,
+      "eval_samples_per_second": 64.256,
+      "eval_steps_per_second": 2.471,
+      "step": 24
+    },
+    {
+      "epoch": 6.842105263157895,
+      "eval_accuracy": 0.5576923076923077,
+      "eval_loss": 0.9886579513549805,
+      "eval_runtime": 0.8147,
+      "eval_samples_per_second": 63.824,
+      "eval_steps_per_second": 2.455,
+      "step": 28
+    },
+    {
+      "epoch": 7.842105263157895,
+      "eval_accuracy": 0.6538461538461539,
+      "eval_loss": 0.8991294503211975,
+      "eval_runtime": 0.8408,
+      "eval_samples_per_second": 61.842,
+      "eval_steps_per_second": 2.379,
+      "step": 32
+    },
+    {
+      "epoch": 8.842105263157894,
+      "grad_norm": 13.655144691467285,
+      "learning_rate": 4.849231551964771e-05,
+      "loss": 0.8599,
+      "step": 36
+    },
+    {
+      "epoch": 8.842105263157894,
+      "eval_accuracy": 0.5576923076923077,
+      "eval_loss": 0.9379385709762573,
+      "eval_runtime": 1.1777,
+      "eval_samples_per_second": 44.155,
+      "eval_steps_per_second": 1.698,
+      "step": 36
+    },
+    {
+      "epoch": 9.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.8260053992271423,
+      "eval_runtime": 0.812,
+      "eval_samples_per_second": 64.04,
+      "eval_steps_per_second": 2.463,
+      "step": 40
+    },
+    {
+      "epoch": 10.842105263157894,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 0.9418205618858337,
+      "eval_runtime": 0.8344,
+      "eval_samples_per_second": 62.322,
+      "eval_steps_per_second": 2.397,
+      "step": 44
+    },
+    {
+      "epoch": 11.842105263157894,
+      "grad_norm": 10.775660514831543,
+      "learning_rate": 4.588719528532342e-05,
+      "loss": 0.6803,
+      "step": 48
+    },
+    {
+      "epoch": 11.842105263157894,
+      "eval_accuracy": 0.5769230769230769,
+      "eval_loss": 0.9368123412132263,
+      "eval_runtime": 0.8144,
+      "eval_samples_per_second": 63.853,
+      "eval_steps_per_second": 2.456,
+      "step": 48
+    },
+    {
+      "epoch": 12.842105263157894,
+      "eval_accuracy": 0.5961538461538461,
+      "eval_loss": 0.9148427248001099,
+      "eval_runtime": 0.839,
+      "eval_samples_per_second": 61.975,
+      "eval_steps_per_second": 2.384,
+      "step": 52
+    },
+    {
+      "epoch": 13.842105263157894,
+      "eval_accuracy": 0.6346153846153846,
+      "eval_loss": 0.9134833216667175,
+      "eval_runtime": 0.813,
+      "eval_samples_per_second": 63.958,
+      "eval_steps_per_second": 2.46,
+      "step": 56
+    },
+    {
+      "epoch": 14.842105263157894,
+      "grad_norm": 9.530640602111816,
+      "learning_rate": 4.215604094671835e-05,
+      "loss": 0.5562,
+      "step": 60
+    },
+    {
+      "epoch": 14.842105263157894,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 0.8476653695106506,
+      "eval_runtime": 0.8424,
+      "eval_samples_per_second": 61.725,
+      "eval_steps_per_second": 2.374,
+      "step": 60
+    },
+    {
+      "epoch": 15.842105263157894,
+      "eval_accuracy": 0.5961538461538461,
+      "eval_loss": 0.8729895353317261,
+      "eval_runtime": 1.1573,
+      "eval_samples_per_second": 44.934,
+      "eval_steps_per_second": 1.728,
+      "step": 64
+    },
+    {
+      "epoch": 16.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.8419771194458008,
+      "eval_runtime": 0.8177,
+      "eval_samples_per_second": 63.59,
+      "eval_steps_per_second": 2.446,
+      "step": 68
+    },
+    {
+      "epoch": 17.842105263157894,
+      "grad_norm": 8.000771522521973,
+      "learning_rate": 3.7500000000000003e-05,
+      "loss": 0.4696,
+      "step": 72
+    },
+    {
+      "epoch": 17.842105263157894,
+      "eval_accuracy": 0.5961538461538461,
+      "eval_loss": 0.9167808294296265,
+      "eval_runtime": 0.838,
+      "eval_samples_per_second": 62.056,
+      "eval_steps_per_second": 2.387,
+      "step": 72
+    },
+    {
+      "epoch": 18.842105263157894,
+      "eval_accuracy": 0.6538461538461539,
+      "eval_loss": 0.9373445510864258,
+      "eval_runtime": 1.1412,
+      "eval_samples_per_second": 45.566,
+      "eval_steps_per_second": 1.753,
+      "step": 76
+    },
+    {
+      "epoch": 19.842105263157894,
+      "eval_accuracy": 0.6538461538461539,
+      "eval_loss": 0.8634236454963684,
+      "eval_runtime": 0.8496,
+      "eval_samples_per_second": 61.205,
+      "eval_steps_per_second": 2.354,
+      "step": 80
+    },
+    {
+      "epoch": 20.842105263157894,
+      "grad_norm": 9.063275337219238,
+      "learning_rate": 3.217008081777726e-05,
+      "loss": 0.3975,
+      "step": 84
+    },
+    {
+      "epoch": 20.842105263157894,
+      "eval_accuracy": 0.6538461538461539,
+      "eval_loss": 0.8694897890090942,
+      "eval_runtime": 1.2852,
+      "eval_samples_per_second": 40.462,
+      "eval_steps_per_second": 1.556,
+      "step": 84
+    },
+    {
+      "epoch": 21.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.895785391330719,
+      "eval_runtime": 0.846,
+      "eval_samples_per_second": 61.463,
+      "eval_steps_per_second": 2.364,
+      "step": 88
+    },
+    {
+      "epoch": 22.842105263157894,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 0.8913831114768982,
+      "eval_runtime": 0.8582,
+      "eval_samples_per_second": 60.592,
+      "eval_steps_per_second": 2.33,
+      "step": 92
+    },
+    {
+      "epoch": 23.842105263157894,
+      "grad_norm": 12.528770446777344,
+      "learning_rate": 2.6453620722761896e-05,
+      "loss": 0.3185,
+      "step": 96
+    },
+    {
+      "epoch": 23.842105263157894,
+      "eval_accuracy": 0.7307692307692307,
+      "eval_loss": 0.8727236390113831,
+      "eval_runtime": 1.2291,
+      "eval_samples_per_second": 42.308,
+      "eval_steps_per_second": 1.627,
+      "step": 96
+    },
+    {
+      "epoch": 24.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.9819768667221069,
+      "eval_runtime": 0.8539,
+      "eval_samples_per_second": 60.9,
+      "eval_steps_per_second": 2.342,
+      "step": 100
+    },
+    {
+      "epoch": 25.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.9263378381729126,
+      "eval_runtime": 0.858,
+      "eval_samples_per_second": 60.608,
+      "eval_steps_per_second": 2.331,
+      "step": 104
+    },
+    {
+      "epoch": 26.842105263157894,
+      "grad_norm": 7.165299415588379,
+      "learning_rate": 2.0658795558326743e-05,
+      "loss": 0.2758,
+      "step": 108
+    },
+    {
+      "epoch": 26.842105263157894,
+      "eval_accuracy": 0.5961538461538461,
+      "eval_loss": 1.054808259010315,
+      "eval_runtime": 0.8748,
+      "eval_samples_per_second": 59.44,
+      "eval_steps_per_second": 2.286,
+      "step": 108
+    },
+    {
+      "epoch": 27.842105263157894,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 0.9832605123519897,
+      "eval_runtime": 0.848,
+      "eval_samples_per_second": 61.321,
+      "eval_steps_per_second": 2.359,
+      "step": 112
+    },
+    {
+      "epoch": 28.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.9491920471191406,
+      "eval_runtime": 1.1489,
+      "eval_samples_per_second": 45.259,
+      "eval_steps_per_second": 1.741,
+      "step": 116
+    },
+    {
+      "epoch": 29.842105263157894,
+      "grad_norm": 6.670631408691406,
+      "learning_rate": 1.509800584902108e-05,
+      "loss": 0.2667,
+      "step": 120
+    },
+    {
+      "epoch": 29.842105263157894,
+      "eval_accuracy": 0.6346153846153846,
+      "eval_loss": 0.9466391205787659,
+      "eval_runtime": 1.2058,
+      "eval_samples_per_second": 43.126,
+      "eval_steps_per_second": 1.659,
+      "step": 120
+    },
+    {
+      "epoch": 30.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 0.9827540516853333,
+      "eval_runtime": 0.891,
+      "eval_samples_per_second": 58.361,
+      "eval_steps_per_second": 2.245,
+      "step": 124
+    },
+    {
+      "epoch": 31.842105263157894,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.1056357622146606,
+      "eval_runtime": 1.0057,
+      "eval_samples_per_second": 51.706,
+      "eval_steps_per_second": 1.989,
+      "step": 128
+    },
+    {
+      "epoch": 32.8421052631579,
+      "grad_norm": 9.746902465820312,
+      "learning_rate": 1.0071035207430352e-05,
+      "loss": 0.2396,
+      "step": 132
+    },
+    {
+      "epoch": 32.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.008310317993164,
+      "eval_runtime": 0.8653,
+      "eval_samples_per_second": 60.096,
+      "eval_steps_per_second": 2.311,
+      "step": 132
+    },
+    {
+      "epoch": 33.8421052631579,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.0039582252502441,
+      "eval_runtime": 1.1067,
+      "eval_samples_per_second": 46.988,
+      "eval_steps_per_second": 1.807,
+      "step": 136
+    },
+    {
+      "epoch": 34.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.0727404356002808,
+      "eval_runtime": 0.871,
+      "eval_samples_per_second": 59.702,
+      "eval_steps_per_second": 2.296,
+      "step": 140
+    },
+    {
+      "epoch": 35.8421052631579,
+      "grad_norm": 6.787887096405029,
+      "learning_rate": 5.848888922025553e-06,
+      "loss": 0.2173,
+      "step": 144
+    },
+    {
+      "epoch": 35.8421052631579,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.0952783823013306,
+      "eval_runtime": 0.8655,
+      "eval_samples_per_second": 60.078,
+      "eval_steps_per_second": 2.311,
+      "step": 144
+    },
+    {
+      "epoch": 36.8421052631579,
+      "eval_accuracy": 0.6538461538461539,
+      "eval_loss": 1.0802111625671387,
+      "eval_runtime": 0.8223,
+      "eval_samples_per_second": 63.238,
+      "eval_steps_per_second": 2.432,
+      "step": 148
+    },
+    {
+      "epoch": 37.8421052631579,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.0445523262023926,
+      "eval_runtime": 0.8767,
+      "eval_samples_per_second": 59.311,
+      "eval_steps_per_second": 2.281,
+      "step": 152
+    },
+    {
+      "epoch": 38.8421052631579,
+      "grad_norm": 9.866899490356445,
+      "learning_rate": 2.659183991914696e-06,
+      "loss": 0.2313,
+      "step": 156
+    },
+    {
+      "epoch": 38.8421052631579,
+      "eval_accuracy": 0.7115384615384616,
+      "eval_loss": 1.0331288576126099,
+      "eval_runtime": 0.9492,
+      "eval_samples_per_second": 54.785,
+      "eval_steps_per_second": 2.107,
+      "step": 156
+    },
+    {
+      "epoch": 39.8421052631579,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.033367395401001,
+      "eval_runtime": 0.8537,
+      "eval_samples_per_second": 60.909,
+      "eval_steps_per_second": 2.343,
+      "step": 160
+    },
+    {
+      "epoch": 40.8421052631579,
+      "eval_accuracy": 0.6923076923076923,
+      "eval_loss": 1.0364012718200684,
+      "eval_runtime": 1.213,
+      "eval_samples_per_second": 42.87,
+      "eval_steps_per_second": 1.649,
+      "step": 164
+    },
+    {
+      "epoch": 41.8421052631579,
+      "grad_norm": 8.560094833374023,
+      "learning_rate": 6.738782355044049e-07,
+      "loss": 0.2129,
+      "step": 168
+    },
+    {
+      "epoch": 41.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.0412724018096924,
+      "eval_runtime": 0.8718,
+      "eval_samples_per_second": 59.645,
+      "eval_steps_per_second": 2.294,
+      "step": 168
+    },
+    {
+      "epoch": 42.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.0407301187515259,
+      "eval_runtime": 0.8961,
+      "eval_samples_per_second": 58.03,
+      "eval_steps_per_second": 2.232,
+      "step": 172
+    },
+    {
+      "epoch": 43.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.0404515266418457,
+      "eval_runtime": 1.1216,
+      "eval_samples_per_second": 46.364,
+      "eval_steps_per_second": 1.783,
+      "step": 176
+    },
+    {
+      "epoch": 44.8421052631579,
+      "grad_norm": 8.422102928161621,
+      "learning_rate": 0.0,
+      "loss": 0.2026,
+      "step": 180
+    },
+    {
+      "epoch": 44.8421052631579,
+      "eval_accuracy": 0.6730769230769231,
+      "eval_loss": 1.0401324033737183,
+      "eval_runtime": 1.2027,
+      "eval_samples_per_second": 43.237,
+      "eval_steps_per_second": 1.663,
+      "step": 180
+    },
+    {
+      "epoch": 44.8421052631579,
+      "step": 180,
+      "total_flos": 8.412779636714373e+17,
+      "train_loss": 0.527855412165324,
+      "train_runtime": 618.6977,
+      "train_samples_per_second": 44.076,
+      "train_steps_per_second": 0.291
+    }
+  ],
+  "logging_steps": 12,
+  "max_steps": 180,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 45,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 8.412779636714373e+17,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}