Uploaded Model

Files changed (5) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.7916666666666666,
+    "eval_f1": 0.7916666666666666,
+    "eval_loss": 0.6077105402946472,
+    "eval_precision": 0.7916666666666666,
+    "eval_recall": 0.7916666666666666,
+    "eval_runtime": 14.6409,
+    "eval_samples_per_second": 4.918,
+    "eval_steps_per_second": 0.615,
+    "total_flos": 6.745130236530524e+17,
+    "train_loss": 0.46818547499807256,
+    "train_runtime": 256.3401,
+    "train_samples_per_second": 4.619,
+    "train_steps_per_second": 0.296
+}

eval_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.7916666666666666,
+    "eval_f1": 0.7916666666666666,
+    "eval_loss": 0.6077105402946472,
+    "eval_precision": 0.7916666666666666,
+    "eval_recall": 0.7916666666666666,
+    "eval_runtime": 14.6409,
+    "eval_samples_per_second": 4.918,
+    "eval_steps_per_second": 0.615
+}

runs/Jun28_19-59-04_9ebddc9a2c63/events.out.tfevents.1687982709.9ebddc9a2c63.259.9 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f3e34b0c2f833440b1533f0d05308af54cb7a59db41995ca392d1cd0dbb0c0ec
+size 551

train_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "total_flos": 6.745130236530524e+17,
+    "train_loss": 0.46818547499807256,
+    "train_runtime": 256.3401,
+    "train_samples_per_second": 4.619,
+    "train_steps_per_second": 0.296
+}

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 76,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.0001736842105263158,
+      "loss": 0.8198,
+      "step": 10
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 0.00014736842105263158,
+      "loss": 0.6848,
+      "step": 20
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.00012105263157894738,
+      "loss": 0.5221,
+      "step": 30
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 9.473684210526316e-05,
+      "loss": 0.573,
+      "step": 40
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.842105263157895e-05,
+      "loss": 0.3598,
+      "step": 50
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 4.210526315789474e-05,
+      "loss": 0.2989,
+      "step": 60
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 1.5789473684210526e-05,
+      "loss": 0.2138,
+      "step": 70
+    },
+    {
+      "epoch": 4.0,
+      "step": 76,
+      "total_flos": 6.745130236530524e+17,
+      "train_loss": 0.46818547499807256,
+      "train_runtime": 256.3401,
+      "train_samples_per_second": 4.619,
+      "train_steps_per_second": 0.296
+    }
+  ],
+  "max_steps": 76,
+  "num_train_epochs": 4,
+  "total_flos": 6.745130236530524e+17,
+  "trial_name": null,
+  "trial_params": null
+}