Uploaded Model

Files changed (5) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.7777777777777778,
+    "eval_f1": 0.7777777777777778,
+    "eval_loss": 0.6395068764686584,
+    "eval_precision": 0.7777777777777778,
+    "eval_recall": 0.7777777777777778,
+    "eval_runtime": 14.2343,
+    "eval_samples_per_second": 5.058,
+    "eval_steps_per_second": 0.632,
+    "total_flos": 3.267011131195392e+17,
+    "train_loss": 0.4909392407065944,
+    "train_runtime": 234.298,
+    "train_samples_per_second": 5.053,
+    "train_steps_per_second": 0.324
+}

eval_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.7777777777777778,
+    "eval_f1": 0.7777777777777778,
+    "eval_loss": 0.6395068764686584,
+    "eval_precision": 0.7777777777777778,
+    "eval_recall": 0.7777777777777778,
+    "eval_runtime": 14.2343,
+    "eval_samples_per_second": 5.058,
+    "eval_steps_per_second": 0.632
+}

runs/Jun29_10-50-52_a13fa1600765/events.out.tfevents.1688036166.a13fa1600765.1864.9 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9cdb7a6741e40be3fe38dce0a7d5bcdf7898371d04675c073b23d7105e32a67e
+size 551

train_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "total_flos": 3.267011131195392e+17,
+    "train_loss": 0.4909392407065944,
+    "train_runtime": 234.298,
+    "train_samples_per_second": 5.053,
+    "train_steps_per_second": 0.324
+}

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 76,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.0001736842105263158,
+      "loss": 0.8136,
+      "step": 10
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 0.00014736842105263158,
+      "loss": 0.712,
+      "step": 20
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.00012105263157894738,
+      "loss": 0.5447,
+      "step": 30
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 9.473684210526316e-05,
+      "loss": 0.6402,
+      "step": 40
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.842105263157895e-05,
+      "loss": 0.3711,
+      "step": 50
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 4.210526315789474e-05,
+      "loss": 0.3626,
+      "step": 60
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 1.5789473684210526e-05,
+      "loss": 0.2064,
+      "step": 70
+    },
+    {
+      "epoch": 4.0,
+      "step": 76,
+      "total_flos": 3.267011131195392e+17,
+      "train_loss": 0.4909392407065944,
+      "train_runtime": 234.298,
+      "train_samples_per_second": 5.053,
+      "train_steps_per_second": 0.324
+    }
+  ],
+  "max_steps": 76,
+  "num_train_epochs": 4,
+  "total_flos": 3.267011131195392e+17,
+  "trial_name": null,
+  "trial_params": null
+}