End of training

Browse files

Files changed (3) hide show

all_results.json +8 -0
test_results.json +8 -0
trainer_state.json +172 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 7.07,
+    "eval_accuracy": 0.5161290322580645,
+    "eval_loss": 1.0765262842178345,
+    "eval_runtime": 74.2165,
+    "eval_samples_per_second": 0.418,
+    "eval_steps_per_second": 0.108
+}

test_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 7.07,
+    "eval_accuracy": 0.5161290322580645,
+    "eval_loss": 1.0765262842178345,
+    "eval_runtime": 74.2165,
+    "eval_samples_per_second": 0.418,
+    "eval_steps_per_second": 0.108
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,172 @@

+{
+  "best_metric": 0.56,
+  "best_model_checkpoint": "finetuned-Accident-Video-subset/checkpoint-84",
+  "epoch": 7.066666666666666,
+  "eval_steps": 500,
+  "global_step": 90,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.11,
+      "learning_rate": 4.938271604938271e-05,
+      "loss": 1.5898,
+      "step": 10
+    },
+    {
+      "epoch": 0.13,
+      "eval_accuracy": 0.48,
+      "eval_loss": 1.317312479019165,
+      "eval_runtime": 78.1417,
+      "eval_samples_per_second": 0.32,
+      "eval_steps_per_second": 0.09,
+      "step": 12
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 4.3209876543209875e-05,
+      "loss": 1.2104,
+      "step": 20
+    },
+    {
+      "epoch": 1.13,
+      "eval_accuracy": 0.4,
+      "eval_loss": 1.2156548500061035,
+      "eval_runtime": 75.0252,
+      "eval_samples_per_second": 0.333,
+      "eval_steps_per_second": 0.093,
+      "step": 24
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 3.7037037037037037e-05,
+      "loss": 1.418,
+      "step": 30
+    },
+    {
+      "epoch": 2.13,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.1616722345352173,
+      "eval_runtime": 75.4314,
+      "eval_samples_per_second": 0.331,
+      "eval_steps_per_second": 0.093,
+      "step": 36
+    },
+    {
+      "epoch": 3.04,
+      "learning_rate": 3.08641975308642e-05,
+      "loss": 1.1202,
+      "step": 40
+    },
+    {
+      "epoch": 3.13,
+      "eval_accuracy": 0.52,
+      "eval_loss": 1.1278761625289917,
+      "eval_runtime": 70.2254,
+      "eval_samples_per_second": 0.356,
+      "eval_steps_per_second": 0.1,
+      "step": 48
+    },
+    {
+      "epoch": 4.02,
+      "learning_rate": 2.4691358024691357e-05,
+      "loss": 1.0015,
+      "step": 50
+    },
+    {
+      "epoch": 4.13,
+      "learning_rate": 1.8518518518518518e-05,
+      "loss": 1.2226,
+      "step": 60
+    },
+    {
+      "epoch": 4.13,
+      "eval_accuracy": 0.48,
+      "eval_loss": 1.1110718250274658,
+      "eval_runtime": 59.6068,
+      "eval_samples_per_second": 0.419,
+      "eval_steps_per_second": 0.117,
+      "step": 60
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 1.2345679012345678e-05,
+      "loss": 1.1886,
+      "step": 70
+    },
+    {
+      "epoch": 5.13,
+      "eval_accuracy": 0.48,
+      "eval_loss": 1.072799801826477,
+      "eval_runtime": 59.8468,
+      "eval_samples_per_second": 0.418,
+      "eval_steps_per_second": 0.117,
+      "step": 72
+    },
+    {
+      "epoch": 6.09,
+      "learning_rate": 6.172839506172839e-06,
+      "loss": 1.0177,
+      "step": 80
+    },
+    {
+      "epoch": 6.13,
+      "eval_accuracy": 0.56,
+      "eval_loss": 1.0452561378479004,
+      "eval_runtime": 60.7954,
+      "eval_samples_per_second": 0.411,
+      "eval_steps_per_second": 0.115,
+      "step": 84
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 0.0,
+      "loss": 1.0443,
+      "step": 90
+    },
+    {
+      "epoch": 7.07,
+      "eval_accuracy": 0.56,
+      "eval_loss": 1.0377601385116577,
+      "eval_runtime": 70.0346,
+      "eval_samples_per_second": 0.357,
+      "eval_steps_per_second": 0.1,
+      "step": 90
+    },
+    {
+      "epoch": 7.07,
+      "step": 90,
+      "total_flos": 4.2242719732383744e+17,
+      "train_loss": 1.2014519691467285,
+      "train_runtime": 1824.3873,
+      "train_samples_per_second": 0.197,
+      "train_steps_per_second": 0.049
+    },
+    {
+      "epoch": 7.07,
+      "eval_accuracy": 0.5161290322580645,
+      "eval_loss": 1.0765262842178345,
+      "eval_runtime": 82.8746,
+      "eval_samples_per_second": 0.374,
+      "eval_steps_per_second": 0.097,
+      "step": 90
+    },
+    {
+      "epoch": 7.07,
+      "eval_accuracy": 0.5161290322580645,
+      "eval_loss": 1.0765262842178345,
+      "eval_runtime": 74.2165,
+      "eval_samples_per_second": 0.418,
+      "eval_steps_per_second": 0.108,
+      "step": 90
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 90,
+  "num_train_epochs": 9223372036854775807,
+  "save_steps": 500,
+  "total_flos": 4.2242719732383744e+17,
+  "trial_name": null,
+  "trial_params": null
+}