End of training

Browse files

Files changed (5) hide show

all_results.json +13 -0
eval_results.json +8 -0
runs/Nov06_02-47-05_9c925b04246e/events.out.tfevents.1699240472.9c925b04246e.8770.1 +3 -0
train_results.json +8 -0
trainer_state.json +502 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 2.99,
+    "eval_accuracy": 0.30788520479242126,
+    "eval_loss": 1.6947710514068604,
+    "eval_runtime": 17.149,
+    "eval_samples_per_second": 209.283,
+    "eval_steps_per_second": 6.589,
+    "total_flos": 2.054868144086016e+18,
+    "train_loss": 1.782613229499292,
+    "train_runtime": 1261.819,
+    "train_samples_per_second": 76.789,
+    "train_steps_per_second": 0.599
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 2.99,
+    "eval_accuracy": 0.30788520479242126,
+    "eval_loss": 1.6947710514068604,
+    "eval_runtime": 17.149,
+    "eval_samples_per_second": 209.283,
+    "eval_steps_per_second": 6.589
+}

runs/Nov06_02-47-05_9c925b04246e/events.out.tfevents.1699240472.9c925b04246e.8770.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:39b626231fe9cdab98c8a2e0d450c9645ed7c3858cfe33f60a8628e97a27b255
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 2.99,
+    "total_flos": 2.054868144086016e+18,
+    "train_loss": 1.782613229499292,
+    "train_runtime": 1261.819,
+    "train_samples_per_second": 76.789,
+    "train_steps_per_second": 0.599
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,502 @@

+{
+  "best_metric": 0.30788520479242126,
+  "best_model_checkpoint": "microsoft/resnet-50/checkpoint-756",
+  "epoch": 2.994059405940594,
+  "global_step": 756,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 6.578947368421053e-06,
+      "loss": 1.9535,
+      "step": 10
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 1.3157894736842106e-05,
+      "loss": 1.9539,
+      "step": 20
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.9736842105263158e-05,
+      "loss": 1.9476,
+      "step": 30
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 2.6315789473684212e-05,
+      "loss": 1.9401,
+      "step": 40
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 3.289473684210527e-05,
+      "loss": 1.9308,
+      "step": 50
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 3.9473684210526316e-05,
+      "loss": 1.9207,
+      "step": 60
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 4.605263157894737e-05,
+      "loss": 1.9125,
+      "step": 70
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 4.970588235294118e-05,
+      "loss": 1.8956,
+      "step": 80
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 4.897058823529412e-05,
+      "loss": 1.8897,
+      "step": 90
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 4.823529411764706e-05,
+      "loss": 1.8761,
+      "step": 100
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 4.75e-05,
+      "loss": 1.8658,
+      "step": 110
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 4.6764705882352944e-05,
+      "loss": 1.8532,
+      "step": 120
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 4.6029411764705885e-05,
+      "loss": 1.8561,
+      "step": 130
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 4.5294117647058826e-05,
+      "loss": 1.8521,
+      "step": 140
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 4.455882352941177e-05,
+      "loss": 1.8386,
+      "step": 150
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4.382352941176471e-05,
+      "loss": 1.8219,
+      "step": 160
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 4.308823529411765e-05,
+      "loss": 1.8281,
+      "step": 170
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 4.235294117647059e-05,
+      "loss": 1.8081,
+      "step": 180
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.161764705882353e-05,
+      "loss": 1.8114,
+      "step": 190
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 4.0882352941176474e-05,
+      "loss": 1.813,
+      "step": 200
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.0147058823529415e-05,
+      "loss": 1.7975,
+      "step": 210
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.9411764705882356e-05,
+      "loss": 1.8039,
+      "step": 220
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 3.86764705882353e-05,
+      "loss": 1.7997,
+      "step": 230
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.794117647058824e-05,
+      "loss": 1.7928,
+      "step": 240
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.720588235294118e-05,
+      "loss": 1.7973,
+      "step": 250
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.24770130955697967,
+      "eval_loss": 1.7939863204956055,
+      "eval_runtime": 18.0712,
+      "eval_samples_per_second": 198.604,
+      "eval_steps_per_second": 6.253,
+      "step": 252
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 3.6470588235294114e-05,
+      "loss": 1.8085,
+      "step": 260
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 3.573529411764706e-05,
+      "loss": 1.7814,
+      "step": 270
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.5e-05,
+      "loss": 1.8047,
+      "step": 280
+    },
+    {
+      "epoch": 1.15,
+      "learning_rate": 3.4264705882352945e-05,
+      "loss": 1.801,
+      "step": 290
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 3.352941176470588e-05,
+      "loss": 1.7883,
+      "step": 300
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.279411764705883e-05,
+      "loss": 1.7824,
+      "step": 310
+    },
+    {
+      "epoch": 1.27,
+      "learning_rate": 3.205882352941177e-05,
+      "loss": 1.774,
+      "step": 320
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 3.132352941176471e-05,
+      "loss": 1.7772,
+      "step": 330
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 3.058823529411765e-05,
+      "loss": 1.7584,
+      "step": 340
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 2.985294117647059e-05,
+      "loss": 1.7609,
+      "step": 350
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 2.9117647058823534e-05,
+      "loss": 1.7864,
+      "step": 360
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 2.838235294117647e-05,
+      "loss": 1.7783,
+      "step": 370
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 2.7647058823529416e-05,
+      "loss": 1.757,
+      "step": 380
+    },
+    {
+      "epoch": 1.54,
+      "learning_rate": 2.6911764705882354e-05,
+      "loss": 1.7539,
+      "step": 390
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.6176470588235295e-05,
+      "loss": 1.7694,
+      "step": 400
+    },
+    {
+      "epoch": 1.62,
+      "learning_rate": 2.5441176470588236e-05,
+      "loss": 1.7601,
+      "step": 410
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 2.4705882352941178e-05,
+      "loss": 1.7417,
+      "step": 420
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 2.397058823529412e-05,
+      "loss": 1.744,
+      "step": 430
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 2.323529411764706e-05,
+      "loss": 1.7491,
+      "step": 440
+    },
+    {
+      "epoch": 1.78,
+      "learning_rate": 2.25e-05,
+      "loss": 1.7387,
+      "step": 450
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 2.1764705882352943e-05,
+      "loss": 1.7526,
+      "step": 460
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 2.1029411764705884e-05,
+      "loss": 1.7361,
+      "step": 470
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 2.0294117647058825e-05,
+      "loss": 1.7344,
+      "step": 480
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 1.9558823529411766e-05,
+      "loss": 1.7211,
+      "step": 490
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.8823529411764708e-05,
+      "loss": 1.7299,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.2803009194761772,
+      "eval_loss": 1.727730393409729,
+      "eval_runtime": 17.3747,
+      "eval_samples_per_second": 206.564,
+      "eval_steps_per_second": 6.504,
+      "step": 505
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 1.808823529411765e-05,
+      "loss": 1.7469,
+      "step": 510
+    },
+    {
+      "epoch": 2.06,
+      "learning_rate": 1.735294117647059e-05,
+      "loss": 1.744,
+      "step": 520
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.6617647058823528e-05,
+      "loss": 1.7489,
+      "step": 530
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 1.588235294117647e-05,
+      "loss": 1.7356,
+      "step": 540
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 1.5147058823529412e-05,
+      "loss": 1.7327,
+      "step": 550
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 1.4411764705882352e-05,
+      "loss": 1.7045,
+      "step": 560
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 1.3676470588235296e-05,
+      "loss": 1.717,
+      "step": 570
+    },
+    {
+      "epoch": 2.3,
+      "learning_rate": 1.2941176470588238e-05,
+      "loss": 1.7335,
+      "step": 580
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 1.2205882352941177e-05,
+      "loss": 1.7338,
+      "step": 590
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 1.1470588235294118e-05,
+      "loss": 1.7145,
+      "step": 600
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 1.0735294117647058e-05,
+      "loss": 1.7349,
+      "step": 610
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 1e-05,
+      "loss": 1.7293,
+      "step": 620
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 9.264705882352942e-06,
+      "loss": 1.7291,
+      "step": 630
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 8.529411764705883e-06,
+      "loss": 1.7192,
+      "step": 640
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 7.794117647058825e-06,
+      "loss": 1.7203,
+      "step": 650
+    },
+    {
+      "epoch": 2.61,
+      "learning_rate": 7.058823529411765e-06,
+      "loss": 1.7403,
+      "step": 660
+    },
+    {
+      "epoch": 2.65,
+      "learning_rate": 6.323529411764706e-06,
+      "loss": 1.7077,
+      "step": 670
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 5.588235294117647e-06,
+      "loss": 1.712,
+      "step": 680
+    },
+    {
+      "epoch": 2.73,
+      "learning_rate": 4.852941176470589e-06,
+      "loss": 1.7327,
+      "step": 690
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 4.11764705882353e-06,
+      "loss": 1.7021,
+      "step": 700
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 3.3823529411764707e-06,
+      "loss": 1.7295,
+      "step": 710
+    },
+    {
+      "epoch": 2.85,
+      "learning_rate": 2.647058823529412e-06,
+      "loss": 1.7288,
+      "step": 720
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 1.911764705882353e-06,
+      "loss": 1.6857,
+      "step": 730
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 1.1764705882352942e-06,
+      "loss": 1.7052,
+      "step": 740
+    },
+    {
+      "epoch": 2.97,
+      "learning_rate": 4.411764705882353e-07,
+      "loss": 1.7096,
+      "step": 750
+    },
+    {
+      "epoch": 2.99,
+      "eval_accuracy": 0.30788520479242126,
+      "eval_loss": 1.6947710514068604,
+      "eval_runtime": 16.9402,
+      "eval_samples_per_second": 211.863,
+      "eval_steps_per_second": 6.671,
+      "step": 756
+    },
+    {
+      "epoch": 2.99,
+      "step": 756,
+      "total_flos": 2.054868144086016e+18,
+      "train_loss": 1.782613229499292,
+      "train_runtime": 1261.819,
+      "train_samples_per_second": 76.789,
+      "train_steps_per_second": 0.599
+    }
+  ],
+  "max_steps": 756,
+  "num_train_epochs": 3,
+  "total_flos": 2.054868144086016e+18,
+  "trial_name": null,
+  "trial_params": null
+}