End of training

Browse files

Files changed (4) hide show

all_results.json +13 -0
eval_results.json +8 -0
train_results.json +8 -0
trainer_state.json +277 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 9.98,
+    "eval_accuracy": 0.9933333333333333,
+    "eval_loss": 0.030707545578479767,
+    "eval_runtime": 47.7279,
+    "eval_samples_per_second": 15.714,
+    "eval_steps_per_second": 0.503,
+    "total_flos": 8.68938785610965e+17,
+    "train_loss": 0.19813838097508307,
+    "train_runtime": 3233.657,
+    "train_samples_per_second": 10.824,
+    "train_steps_per_second": 0.083
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.98,
+    "eval_accuracy": 0.9933333333333333,
+    "eval_loss": 0.030707545578479767,
+    "eval_runtime": 47.7279,
+    "eval_samples_per_second": 15.714,
+    "eval_steps_per_second": 0.503
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.98,
+    "total_flos": 8.68938785610965e+17,
+    "train_loss": 0.19813838097508307,
+    "train_runtime": 3233.657,
+    "train_samples_per_second": 10.824,
+    "train_steps_per_second": 0.083
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,277 @@

+{
+  "best_metric": 0.9933333333333333,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-lcbsi-wbc/checkpoint-135",
+  "epoch": 9.981818181818182,
+  "global_step": 270,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 1.5888,
+      "step": 10
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 1.3668,
+      "step": 20
+    },
+    {
+      "epoch": 0.98,
+      "eval_accuracy": 0.76,
+      "eval_loss": 0.6976749897003174,
+      "eval_runtime": 47.8881,
+      "eval_samples_per_second": 15.662,
+      "eval_steps_per_second": 0.501,
+      "step": 27
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 4.938271604938271e-05,
+      "loss": 0.8641,
+      "step": 30
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 4.732510288065844e-05,
+      "loss": 0.3824,
+      "step": 40
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 4.5267489711934157e-05,
+      "loss": 0.217,
+      "step": 50
+    },
+    {
+      "epoch": 1.98,
+      "eval_accuracy": 0.972,
+      "eval_loss": 0.09920086711645126,
+      "eval_runtime": 46.0407,
+      "eval_samples_per_second": 16.29,
+      "eval_steps_per_second": 0.521,
+      "step": 54
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 4.3209876543209875e-05,
+      "loss": 0.1489,
+      "step": 60
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 4.11522633744856e-05,
+      "loss": 0.119,
+      "step": 70
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 3.909465020576132e-05,
+      "loss": 0.102,
+      "step": 80
+    },
+    {
+      "epoch": 2.98,
+      "eval_accuracy": 0.9853333333333333,
+      "eval_loss": 0.05732276290655136,
+      "eval_runtime": 45.2518,
+      "eval_samples_per_second": 16.574,
+      "eval_steps_per_second": 0.53,
+      "step": 81
+    },
+    {
+      "epoch": 3.33,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 0.0703,
+      "step": 90
+    },
+    {
+      "epoch": 3.69,
+      "learning_rate": 3.497942386831276e-05,
+      "loss": 0.0762,
+      "step": 100
+    },
+    {
+      "epoch": 3.98,
+      "eval_accuracy": 0.976,
+      "eval_loss": 0.10027103871107101,
+      "eval_runtime": 45.6824,
+      "eval_samples_per_second": 16.418,
+      "eval_steps_per_second": 0.525,
+      "step": 108
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 3.292181069958848e-05,
+      "loss": 0.0979,
+      "step": 110
+    },
+    {
+      "epoch": 4.44,
+      "learning_rate": 3.08641975308642e-05,
+      "loss": 0.0633,
+      "step": 120
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 2.880658436213992e-05,
+      "loss": 0.0456,
+      "step": 130
+    },
+    {
+      "epoch": 4.98,
+      "eval_accuracy": 0.9933333333333333,
+      "eval_loss": 0.030707545578479767,
+      "eval_runtime": 47.112,
+      "eval_samples_per_second": 15.92,
+      "eval_steps_per_second": 0.509,
+      "step": 135
+    },
+    {
+      "epoch": 5.18,
+      "learning_rate": 2.6748971193415638e-05,
+      "loss": 0.0369,
+      "step": 140
+    },
+    {
+      "epoch": 5.55,
+      "learning_rate": 2.4691358024691357e-05,
+      "loss": 0.036,
+      "step": 150
+    },
+    {
+      "epoch": 5.91,
+      "learning_rate": 2.2633744855967078e-05,
+      "loss": 0.0219,
+      "step": 160
+    },
+    {
+      "epoch": 5.98,
+      "eval_accuracy": 0.9906666666666667,
+      "eval_loss": 0.04968710243701935,
+      "eval_runtime": 46.2612,
+      "eval_samples_per_second": 16.212,
+      "eval_steps_per_second": 0.519,
+      "step": 162
+    },
+    {
+      "epoch": 6.29,
+      "learning_rate": 2.05761316872428e-05,
+      "loss": 0.0149,
+      "step": 170
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 0.0106,
+      "step": 180
+    },
+    {
+      "epoch": 6.98,
+      "eval_accuracy": 0.9866666666666667,
+      "eval_loss": 0.05681763216853142,
+      "eval_runtime": 46.7081,
+      "eval_samples_per_second": 16.057,
+      "eval_steps_per_second": 0.514,
+      "step": 189
+    },
+    {
+      "epoch": 7.04,
+      "learning_rate": 1.646090534979424e-05,
+      "loss": 0.0194,
+      "step": 190
+    },
+    {
+      "epoch": 7.4,
+      "learning_rate": 1.440329218106996e-05,
+      "loss": 0.009,
+      "step": 200
+    },
+    {
+      "epoch": 7.76,
+      "learning_rate": 1.2345679012345678e-05,
+      "loss": 0.0112,
+      "step": 210
+    },
+    {
+      "epoch": 7.98,
+      "eval_accuracy": 0.9906666666666667,
+      "eval_loss": 0.05316087231040001,
+      "eval_runtime": 46.5686,
+      "eval_samples_per_second": 16.105,
+      "eval_steps_per_second": 0.515,
+      "step": 216
+    },
+    {
+      "epoch": 8.15,
+      "learning_rate": 1.02880658436214e-05,
+      "loss": 0.0081,
+      "step": 220
+    },
+    {
+      "epoch": 8.51,
+      "learning_rate": 8.23045267489712e-06,
+      "loss": 0.0085,
+      "step": 230
+    },
+    {
+      "epoch": 8.87,
+      "learning_rate": 6.172839506172839e-06,
+      "loss": 0.0067,
+      "step": 240
+    },
+    {
+      "epoch": 8.98,
+      "eval_accuracy": 0.9906666666666667,
+      "eval_loss": 0.052792128175497055,
+      "eval_runtime": 46.6713,
+      "eval_samples_per_second": 16.07,
+      "eval_steps_per_second": 0.514,
+      "step": 243
+    },
+    {
+      "epoch": 9.25,
+      "learning_rate": 4.11522633744856e-06,
+      "loss": 0.0119,
+      "step": 250
+    },
+    {
+      "epoch": 9.62,
+      "learning_rate": 2.05761316872428e-06,
+      "loss": 0.0043,
+      "step": 260
+    },
+    {
+      "epoch": 9.98,
+      "learning_rate": 0.0,
+      "loss": 0.008,
+      "step": 270
+    },
+    {
+      "epoch": 9.98,
+      "eval_accuracy": 0.992,
+      "eval_loss": 0.048162445425987244,
+      "eval_runtime": 48.9109,
+      "eval_samples_per_second": 15.334,
+      "eval_steps_per_second": 0.491,
+      "step": 270
+    },
+    {
+      "epoch": 9.98,
+      "step": 270,
+      "total_flos": 8.68938785610965e+17,
+      "train_loss": 0.19813838097508307,
+      "train_runtime": 3233.657,
+      "train_samples_per_second": 10.824,
+      "train_steps_per_second": 0.083
+    }
+  ],
+  "max_steps": 270,
+  "num_train_epochs": 10,
+  "total_flos": 8.68938785610965e+17,
+  "trial_name": null,
+  "trial_params": null
+}