Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

adapter_model.bin +1 -1
all_results.json +15 -15
eval_results.json +10 -10
runs/Apr02_17-26-38_31946dd99e45/events.out.tfevents.1712078800.31946dd99e45.34.0 +3 -0
runs/Apr02_17-29-10_31946dd99e45/events.out.tfevents.1712078950.31946dd99e45.34.1 +3 -0
runs/Apr02_17-29-10_31946dd99e45/events.out.tfevents.1712083110.31946dd99e45.34.2 +3 -0
train_results.json +6 -6
trainer_state.json +21 -178

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:247fc2b9ff6d183a31785d3f2a3b4287662c9c74c22d00915bfc7758ee61e6a1
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:ab078ca42c5033790a59a7d1b8ea5cb025038f8778b8bb368725c814de1dcb99
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 1.0,
-    "eval_accuracy": 0.7666666666666667,
-    "eval_f1_score": 0.7609087348217781,
-    "eval_gmean": 0.7486572528549951,
-    "eval_loss": 0.5165690183639526,
-    "eval_precision": 0.7716666666666666,
-    "eval_recall": 0.7666666666666667,
-    "eval_runtime": 170.2423,
-    "eval_samples_per_second": 0.352,
-    "eval_steps_per_second": 0.047,
-    "total_flos": 2.597706419798016e+16,
-    "train_loss": 0.7354364809782609,
-    "train_runtime": 6240.8638,
-    "train_samples_per_second": 2.838,
-    "train_steps_per_second": 0.022
 }

 {
+    "epoch": 1.95,
+    "eval_accuracy": 0.85,
+    "eval_f1_score": 0.8512605042016806,
+    "eval_gmean": 0.8238099238888024,
+    "eval_loss": 0.35761719942092896,
+    "eval_precision": 0.853042328042328,
+    "eval_recall": 0.85,
+    "eval_runtime": 183.8915,
+    "eval_samples_per_second": 0.326,
+    "eval_steps_per_second": 0.044,
+    "total_flos": 2.536276286767104e+16,
+    "train_loss": 2.198583984375,
+    "train_runtime": 3976.3696,
+    "train_samples_per_second": 0.323,
+    "train_steps_per_second": 0.005
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 1.0,
-    "eval_accuracy": 0.7666666666666667,
-    "eval_f1_score": 0.7609087348217781,
-    "eval_gmean": 0.7486572528549951,
-    "eval_loss": 0.5165690183639526,
-    "eval_precision": 0.7716666666666666,
-    "eval_recall": 0.7666666666666667,
-    "eval_runtime": 170.2423,
-    "eval_samples_per_second": 0.352,
-    "eval_steps_per_second": 0.047
 }

 {
+    "epoch": 1.95,
+    "eval_accuracy": 0.85,
+    "eval_f1_score": 0.8512605042016806,
+    "eval_gmean": 0.8238099238888024,
+    "eval_loss": 0.35761719942092896,
+    "eval_precision": 0.853042328042328,
+    "eval_recall": 0.85,
+    "eval_runtime": 183.8915,
+    "eval_samples_per_second": 0.326,
+    "eval_steps_per_second": 0.044
 }

runs/Apr02_17-26-38_31946dd99e45/events.out.tfevents.1712078800.31946dd99e45.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96fa4882ae747c17ae6288324d4a105bd8f2ae5dd58f60c2079ff967f2398820
+size 4955

runs/Apr02_17-29-10_31946dd99e45/events.out.tfevents.1712078950.31946dd99e45.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9970172f636f426cd33f169855d48cf2f4881c2a5897cb54c74bf0e5092d4a3
+size 5717

runs/Apr02_17-29-10_31946dd99e45/events.out.tfevents.1712083110.31946dd99e45.34.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10bde09e68dd9cd3cb5b78de3ee14312b99d065290ec56a677e02b4f5ff93407
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "total_flos": 2.597706419798016e+16,
-    "train_loss": 0.7354364809782609,
-    "train_runtime": 6240.8638,
-    "train_samples_per_second": 2.838,
-    "train_steps_per_second": 0.022
 }

 {
+    "epoch": 1.95,
+    "total_flos": 2.536276286767104e+16,
+    "train_loss": 2.198583984375,
+    "train_runtime": 3976.3696,
+    "train_samples_per_second": 0.323,
+    "train_steps_per_second": 0.005
 }

trainer_state.json CHANGED Viewed

@@ -1,201 +1,44 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.9963898916967509,
   "eval_steps": 28,
-  "global_step": 138,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.06,
-      "grad_norm": 4.96875,
-      "learning_rate": 1.911764705882353e-05,
-      "loss": 0.7457,
       "step": 8
     },
     {
-      "epoch": 0.12,
-      "grad_norm": 12.75,
-      "learning_rate": 1.7941176470588237e-05,
-      "loss": 0.7997,
       "step": 16
     },
     {
-      "epoch": 0.17,
-      "grad_norm": 7.5625,
-      "learning_rate": 1.6764705882352943e-05,
-      "loss": 0.7616,
-      "step": 24
-    },
-    {
-      "epoch": 0.2,
-      "eval_accuracy": 0.7666666666666667,
-      "eval_f1_score": 0.7609087348217781,
-      "eval_gmean": 0.7486572528549951,
-      "eval_loss": 0.5174153447151184,
-      "eval_precision": 0.7716666666666666,
-      "eval_recall": 0.7666666666666667,
-      "eval_runtime": 170.072,
-      "eval_samples_per_second": 0.353,
-      "eval_steps_per_second": 0.047,
-      "step": 28
-    },
-    {
-      "epoch": 0.23,
-      "grad_norm": 18.0,
-      "learning_rate": 1.558823529411765e-05,
-      "loss": 0.7458,
-      "step": 32
-    },
-    {
-      "epoch": 0.29,
-      "grad_norm": 7.78125,
-      "learning_rate": 1.4411764705882353e-05,
-      "loss": 0.691,
-      "step": 40
-    },
-    {
-      "epoch": 0.35,
-      "grad_norm": 5.78125,
-      "learning_rate": 1.323529411764706e-05,
-      "loss": 0.7286,
-      "step": 48
-    },
-    {
-      "epoch": 0.4,
-      "grad_norm": 6.40625,
-      "learning_rate": 1.2058823529411765e-05,
-      "loss": 0.8156,
-      "step": 56
-    },
-    {
-      "epoch": 0.4,
-      "eval_accuracy": 0.7666666666666667,
-      "eval_f1_score": 0.7609087348217781,
-      "eval_gmean": 0.7486572528549951,
-      "eval_loss": 0.5176106691360474,
-      "eval_precision": 0.7716666666666666,
-      "eval_recall": 0.7666666666666667,
-      "eval_runtime": 170.1289,
-      "eval_samples_per_second": 0.353,
-      "eval_steps_per_second": 0.047,
-      "step": 56
-    },
-    {
-      "epoch": 0.46,
-      "grad_norm": 10.3125,
-      "learning_rate": 1.0882352941176471e-05,
-      "loss": 0.7198,
-      "step": 64
-    },
-    {
-      "epoch": 0.52,
-      "grad_norm": 9.0625,
-      "learning_rate": 9.705882352941177e-06,
-      "loss": 0.7421,
-      "step": 72
-    },
-    {
-      "epoch": 0.58,
-      "grad_norm": 6.625,
-      "learning_rate": 8.529411764705883e-06,
-      "loss": 0.7488,
-      "step": 80
-    },
-    {
-      "epoch": 0.61,
-      "eval_accuracy": 0.7666666666666667,
-      "eval_f1_score": 0.7609087348217781,
-      "eval_gmean": 0.7486572528549951,
-      "eval_loss": 0.5164387822151184,
-      "eval_precision": 0.7716666666666666,
-      "eval_recall": 0.7666666666666667,
-      "eval_runtime": 170.831,
-      "eval_samples_per_second": 0.351,
-      "eval_steps_per_second": 0.047,
-      "step": 84
-    },
-    {
-      "epoch": 0.64,
-      "grad_norm": 6.125,
-      "learning_rate": 7.352941176470589e-06,
-      "loss": 0.7045,
-      "step": 88
-    },
-    {
-      "epoch": 0.69,
-      "grad_norm": 4.625,
-      "learning_rate": 6.176470588235295e-06,
-      "loss": 0.6564,
-      "step": 96
-    },
-    {
-      "epoch": 0.75,
-      "grad_norm": 8.3125,
-      "learning_rate": 5e-06,
-      "loss": 0.7003,
-      "step": 104
-    },
-    {
-      "epoch": 0.81,
-      "grad_norm": 12.9375,
-      "learning_rate": 3.8235294117647055e-06,
-      "loss": 0.7528,
-      "step": 112
-    },
-    {
-      "epoch": 0.81,
-      "eval_accuracy": 0.7666666666666667,
-      "eval_f1_score": 0.7609087348217781,
-      "eval_gmean": 0.7486572528549951,
-      "eval_loss": 0.5166015625,
-      "eval_precision": 0.7716666666666666,
-      "eval_recall": 0.7666666666666667,
-      "eval_runtime": 170.3596,
-      "eval_samples_per_second": 0.352,
-      "eval_steps_per_second": 0.047,
-      "step": 112
-    },
-    {
-      "epoch": 0.87,
-      "grad_norm": 7.46875,
-      "learning_rate": 2.647058823529412e-06,
-      "loss": 0.7045,
-      "step": 120
-    },
-    {
-      "epoch": 0.92,
-      "grad_norm": 5.8125,
-      "learning_rate": 1.4705882352941177e-06,
-      "loss": 0.7029,
-      "step": 128
-    },
-    {
-      "epoch": 0.98,
-      "grad_norm": 10.1875,
-      "learning_rate": 2.9411764705882356e-07,
-      "loss": 0.7869,
-      "step": 136
-    },
-    {
-      "epoch": 1.0,
-      "step": 138,
-      "total_flos": 2.597706419798016e+16,
-      "train_loss": 0.7354364809782609,
-      "train_runtime": 6240.8638,
-      "train_samples_per_second": 2.838,
-      "train_steps_per_second": 0.022
     }
   ],
   "logging_steps": 8,
-  "max_steps": 138,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 2.597706419798016e+16,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.951219512195122,
   "eval_steps": 28,
+  "global_step": 20,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.78,
+      "grad_norm": 39.25,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 2.3276,
       "step": 8
     },
     {
+      "epoch": 1.56,
+      "grad_norm": 25.75,
+      "learning_rate": 4.444444444444444e-06,
+      "loss": 1.9921,
       "step": 16
     },
     {
+      "epoch": 1.95,
+      "step": 20,
+      "total_flos": 2.536276286767104e+16,
+      "train_loss": 2.198583984375,
+      "train_runtime": 3976.3696,
+      "train_samples_per_second": 0.323,
+      "train_steps_per_second": 0.005
     }
   ],
   "logging_steps": 8,
+  "max_steps": 20,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
   "save_steps": 500,
+  "total_flos": 2.536276286767104e+16,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }