Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

adapter_model.bin +1 -1
all_results.json +15 -15
eval_results.json +10 -10
runs/Mar31_00-08-10_a67b165e443d/events.out.tfevents.1711843692.a67b165e443d.34.0 +3 -0
runs/Mar31_00-13-11_a67b165e443d/events.out.tfevents.1711843992.a67b165e443d.34.1 +3 -0
runs/Mar31_00-13-11_a67b165e443d/events.out.tfevents.1711863078.a67b165e443d.34.2 +3 -0
train_results.json +6 -6
trainer_state.json +93 -177

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c165d0b62d01dd989a09b638f70d1e0e4cc65d4e4e67081b177d4fbad18e25a
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:93aa0cf7d99ad26d47d8643e22d1ffc2cdf84ec975fa62bf6a3744af6d78bffa
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 1.0,
-    "eval_accuracy": 0.87,
-    "eval_f1_score": 0.8705157155935307,
-    "eval_gmean": 0.8715093639362524,
-    "eval_loss": 0.26673829555511475,
-    "eval_precision": 0.8726060606060605,
-    "eval_recall": 0.87,
-    "eval_runtime": 328.4912,
-    "eval_samples_per_second": 0.304,
-    "eval_steps_per_second": 0.04,
-    "total_flos": 1.0505428534296576e+17,
-    "train_loss": 0.3696013659965701,
-    "train_runtime": 20858.2303,
-    "train_samples_per_second": 0.252,
-    "train_steps_per_second": 0.004
 }

 {
+    "epoch": 0.99,
+    "eval_accuracy": 0.84,
+    "eval_f1_score": 0.8423376623376623,
+    "eval_gmean": 0.8605301007689224,
+    "eval_loss": 0.3891015648841858,
+    "eval_precision": 0.8687999999999999,
+    "eval_recall": 0.84,
+    "eval_runtime": 156.3274,
+    "eval_samples_per_second": 0.32,
+    "eval_steps_per_second": 0.045,
+    "total_flos": 1.171238676922368e+17,
+    "train_loss": 0.9641927083333334,
+    "train_runtime": 18930.2986,
+    "train_samples_per_second": 0.317,
+    "train_steps_per_second": 0.005
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 1.0,
-    "eval_accuracy": 0.87,
-    "eval_f1_score": 0.8705157155935307,
-    "eval_gmean": 0.8715093639362524,
-    "eval_loss": 0.26673829555511475,
-    "eval_precision": 0.8726060606060605,
-    "eval_recall": 0.87,
-    "eval_runtime": 328.4912,
-    "eval_samples_per_second": 0.304,
-    "eval_steps_per_second": 0.04
 }

 {
+    "epoch": 0.99,
+    "eval_accuracy": 0.84,
+    "eval_f1_score": 0.8423376623376623,
+    "eval_gmean": 0.8605301007689224,
+    "eval_loss": 0.3891015648841858,
+    "eval_precision": 0.8687999999999999,
+    "eval_recall": 0.84,
+    "eval_runtime": 156.3274,
+    "eval_samples_per_second": 0.32,
+    "eval_steps_per_second": 0.045
 }

runs/Mar31_00-08-10_a67b165e443d/events.out.tfevents.1711843692.a67b165e443d.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b7a1a0cb5f8040ad8c4dcd07d9a78b1fe78c847cbe32b10144f0fbf81c6bec3
+size 4919

runs/Mar31_00-13-11_a67b165e443d/events.out.tfevents.1711843992.a67b165e443d.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:32887d276cf285148292e7134729f00a457bddcb533578fc2b61d2bbd63f61dd
+size 9095

runs/Mar31_00-13-11_a67b165e443d/events.out.tfevents.1711863078.a67b165e443d.34.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:62af20f2ac529efff6289f4571b270ba4b39f7fb509e997638675b8df412ad02
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "total_flos": 1.0505428534296576e+17,
-    "train_loss": 0.3696013659965701,
-    "train_runtime": 20858.2303,
-    "train_samples_per_second": 0.252,
-    "train_steps_per_second": 0.004
 }

 {
+    "epoch": 0.99,
+    "total_flos": 1.171238676922368e+17,
+    "train_loss": 0.9641927083333334,
+    "train_runtime": 18930.2986,
+    "train_samples_per_second": 0.317,
+    "train_steps_per_second": 0.005
 }

trainer_state.json CHANGED Viewed

@@ -1,229 +1,145 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.9969604863221885,
-  "eval_steps": 8,
-  "global_step": 82,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.1,
-      "grad_norm": 6.875,
-      "learning_rate": 1.8500000000000002e-05,
-      "loss": 0.3831,
       "step": 8
     },
     {
-      "epoch": 0.1,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2664209008216858,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.1061,
-      "eval_samples_per_second": 0.308,
-      "eval_steps_per_second": 0.04,
-      "step": 8
-    },
-    {
-      "epoch": 0.19,
-      "grad_norm": 7.4375,
-      "learning_rate": 1.65e-05,
-      "loss": 0.3261,
       "step": 16
     },
     {
-      "epoch": 0.19,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.26719239354133606,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.6461,
-      "eval_samples_per_second": 0.307,
-      "eval_steps_per_second": 0.04,
-      "step": 16
-    },
-    {
-      "epoch": 0.29,
-      "grad_norm": 10.5625,
-      "learning_rate": 1.45e-05,
-      "loss": 0.3721,
-      "step": 24
-    },
-    {
-      "epoch": 0.29,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2671875059604645,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.3707,
-      "eval_samples_per_second": 0.307,
-      "eval_steps_per_second": 0.04,
       "step": 24
     },
     {
-      "epoch": 0.39,
-      "grad_norm": 9.5,
-      "learning_rate": 1.25e-05,
-      "loss": 0.3582,
-      "step": 32
     },
     {
-      "epoch": 0.39,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2667529284954071,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.8406,
-      "eval_samples_per_second": 0.307,
-      "eval_steps_per_second": 0.04,
       "step": 32
     },
     {
-      "epoch": 0.49,
-      "grad_norm": 5.84375,
-      "learning_rate": 1.0500000000000001e-05,
-      "loss": 0.4175,
       "step": 40
     },
     {
-      "epoch": 0.49,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.26649415493011475,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.6291,
-      "eval_samples_per_second": 0.307,
-      "eval_steps_per_second": 0.04,
-      "step": 40
-    },
-    {
-      "epoch": 0.58,
-      "grad_norm": 4.90625,
-      "learning_rate": 8.5e-06,
-      "loss": 0.2994,
-      "step": 48
-    },
-    {
-      "epoch": 0.58,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2669140696525574,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 325.6436,
-      "eval_samples_per_second": 0.307,
-      "eval_steps_per_second": 0.04,
       "step": 48
     },
     {
-      "epoch": 0.68,
-      "grad_norm": 7.375,
-      "learning_rate": 6.5000000000000004e-06,
-      "loss": 0.3524,
       "step": 56
     },
     {
-      "epoch": 0.68,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2667480409145355,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 328.7964,
-      "eval_samples_per_second": 0.304,
-      "eval_steps_per_second": 0.04,
       "step": 56
     },
     {
-      "epoch": 0.78,
-      "grad_norm": 5.40625,
-      "learning_rate": 4.5e-06,
-      "loss": 0.3961,
-      "step": 64
-    },
-    {
-      "epoch": 0.78,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.26673829555511475,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 327.9706,
-      "eval_samples_per_second": 0.305,
-      "eval_steps_per_second": 0.04,
       "step": 64
     },
     {
-      "epoch": 0.88,
-      "grad_norm": 8.3125,
-      "learning_rate": 2.5e-06,
-      "loss": 0.4341,
-      "step": 72
-    },
-    {
-      "epoch": 0.88,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.26673829555511475,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 328.7312,
-      "eval_samples_per_second": 0.304,
-      "eval_steps_per_second": 0.04,
       "step": 72
     },
     {
-      "epoch": 0.97,
-      "grad_norm": 6.3125,
-      "learning_rate": 5.000000000000001e-07,
-      "loss": 0.3743,
-      "step": 80
-    },
-    {
-      "epoch": 0.97,
-      "eval_accuracy": 0.87,
-      "eval_f1_score": 0.8705157155935307,
-      "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.26673829555511475,
-      "eval_precision": 0.8726060606060605,
-      "eval_recall": 0.87,
-      "eval_runtime": 328.568,
-      "eval_samples_per_second": 0.304,
-      "eval_steps_per_second": 0.04,
       "step": 80
     },
     {
-      "epoch": 1.0,
-      "step": 82,
-      "total_flos": 1.0505428534296576e+17,
-      "train_loss": 0.3696013659965701,
-      "train_runtime": 20858.2303,
-      "train_samples_per_second": 0.252,
-      "train_steps_per_second": 0.004
     }
   ],
   "logging_steps": 8,
-  "max_steps": 82,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 1.0505428534296576e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.992,
+  "eval_steps": 28,
+  "global_step": 93,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.09,
+      "grad_norm": 35.25,
+      "learning_rate": 1.8681318681318682e-05,
+      "loss": 1.1454,
       "step": 8
     },
     {
+      "epoch": 0.17,
+      "grad_norm": 36.5,
+      "learning_rate": 1.6923076923076924e-05,
+      "loss": 1.1827,
       "step": 16
     },
     {
+      "epoch": 0.26,
+      "grad_norm": 34.0,
+      "learning_rate": 1.5164835164835166e-05,
+      "loss": 1.1057,
       "step": 24
     },
     {
+      "epoch": 0.3,
+      "eval_accuracy": 0.82,
+      "eval_f1_score": 0.8225454545454545,
+      "eval_gmean": 0.844292130744656,
+      "eval_loss": 0.4087499976158142,
+      "eval_precision": 0.8572435897435898,
+      "eval_recall": 0.82,
+      "eval_runtime": 156.306,
+      "eval_samples_per_second": 0.32,
+      "eval_steps_per_second": 0.045,
+      "step": 28
     },
     {
+      "epoch": 0.34,
+      "grad_norm": 30.75,
+      "learning_rate": 1.3406593406593406e-05,
+      "loss": 0.9439,
       "step": 32
     },
     {
+      "epoch": 0.43,
+      "grad_norm": 35.25,
+      "learning_rate": 1.164835164835165e-05,
+      "loss": 0.9382,
       "step": 40
     },
     {
+      "epoch": 0.51,
+      "grad_norm": 35.25,
+      "learning_rate": 9.890109890109892e-06,
+      "loss": 0.9136,
       "step": 48
     },
     {
+      "epoch": 0.6,
+      "grad_norm": 35.75,
+      "learning_rate": 8.131868131868132e-06,
+      "loss": 0.8892,
       "step": 56
     },
     {
+      "epoch": 0.6,
+      "eval_accuracy": 0.84,
+      "eval_f1_score": 0.8423376623376623,
+      "eval_gmean": 0.8605301007689224,
+      "eval_loss": 0.39445313811302185,
+      "eval_precision": 0.8687999999999999,
+      "eval_recall": 0.84,
+      "eval_runtime": 156.2149,
+      "eval_samples_per_second": 0.32,
+      "eval_steps_per_second": 0.045,
       "step": 56
     },
     {
+      "epoch": 0.68,
+      "grad_norm": 25.0,
+      "learning_rate": 6.373626373626373e-06,
+      "loss": 0.9037,
       "step": 64
     },
     {
+      "epoch": 0.77,
+      "grad_norm": 19.25,
+      "learning_rate": 4.615384615384616e-06,
+      "loss": 0.8933,
       "step": 72
     },
     {
+      "epoch": 0.85,
+      "grad_norm": 21.0,
+      "learning_rate": 2.8571428571428573e-06,
+      "loss": 0.8473,
       "step": 80
     },
     {
+      "epoch": 0.9,
+      "eval_accuracy": 0.84,
+      "eval_f1_score": 0.8423376623376623,
+      "eval_gmean": 0.8605301007689224,
+      "eval_loss": 0.3901953101158142,
+      "eval_precision": 0.8687999999999999,
+      "eval_recall": 0.84,
+      "eval_runtime": 155.9323,
+      "eval_samples_per_second": 0.321,
+      "eval_steps_per_second": 0.045,
+      "step": 84
+    },
+    {
+      "epoch": 0.94,
+      "grad_norm": 32.5,
+      "learning_rate": 1.098901098901099e-06,
+      "loss": 0.8776,
+      "step": 88
+    },
+    {
+      "epoch": 0.99,
+      "step": 93,
+      "total_flos": 1.171238676922368e+17,
+      "train_loss": 0.9641927083333334,
+      "train_runtime": 18930.2986,
+      "train_samples_per_second": 0.317,
+      "train_steps_per_second": 0.005
     }
   ],
   "logging_steps": 8,
+  "max_steps": 93,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
+  "total_flos": 1.171238676922368e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null