End of training

Browse files

Files changed (4) hide show

all_results.json +14 -0
eval_results.json +9 -0
train_results.json +8 -0
trainer_state.json +61 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.6425992779783394,
+    "eval_loss": 0.8855097889900208,
+    "eval_runtime": 0.5437,
+    "eval_samples": 277,
+    "eval_samples_per_second": 509.501,
+    "eval_steps_per_second": 9.197,
+    "train_loss": 0.4733937581380208,
+    "train_runtime": 55.8553,
+    "train_samples": 2490,
+    "train_samples_per_second": 178.318,
+    "train_steps_per_second": 5.586
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.6425992779783394,
+    "eval_loss": 0.8855097889900208,
+    "eval_runtime": 0.5437,
+    "eval_samples": 277,
+    "eval_samples_per_second": 509.501,
+    "eval_steps_per_second": 9.197
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 4.0,
+    "train_loss": 0.4733937581380208,
+    "train_runtime": 55.8553,
+    "train_samples": 2490,
+    "train_samples_per_second": 178.318,
+    "train_steps_per_second": 5.586
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 312,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.6587319374084473,
+      "eval_runtime": 0.8033,
+      "eval_samples_per_second": 344.835,
+      "eval_steps_per_second": 6.224,
+      "step": 78
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.6506237387657166,
+      "eval_runtime": 0.5527,
+      "eval_samples_per_second": 501.182,
+      "eval_steps_per_second": 9.047,
+      "step": 156
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6209386281588448,
+      "eval_loss": 0.7936134934425354,
+      "eval_runtime": 0.5447,
+      "eval_samples_per_second": 508.561,
+      "eval_steps_per_second": 9.18,
+      "step": 234
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6425992779783394,
+      "eval_loss": 0.8855097889900208,
+      "eval_runtime": 0.546,
+      "eval_samples_per_second": 507.309,
+      "eval_steps_per_second": 9.157,
+      "step": 312
+    },
+    {
+      "epoch": 4.0,
+      "step": 312,
+      "total_flos": 1310293055692800.0,
+      "train_loss": 0.4733937581380208,
+      "train_runtime": 55.8553,
+      "train_samples_per_second": 178.318,
+      "train_steps_per_second": 5.586
+    }
+  ],
+  "max_steps": 312,
+  "num_train_epochs": 4,
+  "total_flos": 1310293055692800.0,
+  "trial_name": null,
+  "trial_params": null
+}