Uploaded Model

Files changed (5) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.75,
+    "eval_f1": 0.75,
+    "eval_loss": 0.7317161560058594,
+    "eval_precision": 0.75,
+    "eval_recall": 0.75,
+    "eval_runtime": 14.5021,
+    "eval_samples_per_second": 4.965,
+    "eval_steps_per_second": 0.621,
+    "total_flos": 3.243391650443428e+17,
+    "train_loss": 0.7330392410880641,
+    "train_runtime": 246.0573,
+    "train_samples_per_second": 4.812,
+    "train_steps_per_second": 0.309
+}

eval_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "eval_accuracy": 0.75,
+    "eval_f1": 0.75,
+    "eval_loss": 0.7317161560058594,
+    "eval_precision": 0.75,
+    "eval_recall": 0.75,
+    "eval_runtime": 14.5021,
+    "eval_samples_per_second": 4.965,
+    "eval_steps_per_second": 0.621
+}

runs/Jun28_19-47-00_9ebddc9a2c63/events.out.tfevents.1687981938.9ebddc9a2c63.259.5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:10391255c80b41569d6b5b71d5283ba19940b027b56e0605e81887dd477ea895
+size 551

train_results.json ADDED Viewed

+{
+    "epoch": 4.0,
+    "total_flos": 3.243391650443428e+17,
+    "train_loss": 0.7330392410880641,
+    "train_runtime": 246.0573,
+    "train_samples_per_second": 4.812,
+    "train_steps_per_second": 0.309
+}

trainer_state.json ADDED Viewed

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.0,
+  "global_step": 76,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.0001736842105263158,
+      "loss": 0.886,
+      "step": 10
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 0.00014736842105263158,
+      "loss": 0.7462,
+      "step": 20
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 0.00012105263157894738,
+      "loss": 0.6289,
+      "step": 30
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 9.473684210526316e-05,
+      "loss": 0.8637,
+      "step": 40
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.842105263157895e-05,
+      "loss": 0.705,
+      "step": 50
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 4.210526315789474e-05,
+      "loss": 0.6985,
+      "step": 60
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 1.5789473684210526e-05,
+      "loss": 0.6976,
+      "step": 70
+    },
+    {
+      "epoch": 4.0,
+      "step": 76,
+      "total_flos": 3.243391650443428e+17,
+      "train_loss": 0.7330392410880641,
+      "train_runtime": 246.0573,
+      "train_samples_per_second": 4.812,
+      "train_steps_per_second": 0.309
+    }
+  ],
+  "max_steps": 76,
+  "num_train_epochs": 4,
+  "total_flos": 3.243391650443428e+17,
+  "trial_name": null,
+  "trial_params": null
+}