Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

adapter_model.bin +1 -1
all_results.json +12 -12
eval_results.json +9 -9
runs/Mar23_19-24-50_5b81996377db/events.out.tfevents.1711221893.5b81996377db.34.0 +3 -0
runs/Mar23_19-25-37_5b81996377db/events.out.tfevents.1711222554.5b81996377db.34.1 +3 -0
runs/Mar23_19-38-54_5b81996377db/events.out.tfevents.1711222735.5b81996377db.34.2 +3 -0
runs/Mar23_19-38-54_5b81996377db/events.out.tfevents.1711242642.5b81996377db.34.3 +3 -0
train_results.json +3 -3
trainer_state.json +108 -108

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:81e47e78eaa0ab1d7cf0e0db26eeeaa88d99a7a98f4797d4c0f1ce9089a6d187
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:9bfec96e37ef6634530ef3293f303bd6acefe9e3e6d6abfe2f6ce7328f075f8a
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
     "epoch": 1.0,
-    "eval_accuracy": 0.86,
-    "eval_f1_score": 0.8603998368013055,
-    "eval_gmean": 0.8596058209945328,
-    "eval_loss": 0.2712109386920929,
-    "eval_precision": 0.8614935064935065,
-    "eval_recall": 0.86,
-    "eval_runtime": 298.9366,
-    "eval_samples_per_second": 0.335,
-    "eval_steps_per_second": 0.043,
     "total_flos": 1.0505428534296576e+17,
-    "train_loss": 0.370269775390625,
-    "train_runtime": 19024.4402,
-    "train_samples_per_second": 0.276,
     "train_steps_per_second": 0.004
 }

 {
     "epoch": 1.0,
+    "eval_accuracy": 0.87,
+    "eval_f1_score": 0.8705157155935307,
+    "eval_gmean": 0.8715093639362524,
+    "eval_loss": 0.26869142055511475,
+    "eval_precision": 0.8726060606060605,
+    "eval_recall": 0.87,
+    "eval_runtime": 308.1312,
+    "eval_samples_per_second": 0.325,
+    "eval_steps_per_second": 0.042,
     "total_flos": 1.0505428534296576e+17,
+    "train_loss": 0.3734391375285823,
+    "train_runtime": 19598.5588,
+    "train_samples_per_second": 0.268,
     "train_steps_per_second": 0.004
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 1.0,
-    "eval_accuracy": 0.86,
-    "eval_f1_score": 0.8603998368013055,
-    "eval_gmean": 0.8596058209945328,
-    "eval_loss": 0.2712109386920929,
-    "eval_precision": 0.8614935064935065,
-    "eval_recall": 0.86,
-    "eval_runtime": 298.9366,
-    "eval_samples_per_second": 0.335,
-    "eval_steps_per_second": 0.043
 }

 {
     "epoch": 1.0,
+    "eval_accuracy": 0.87,
+    "eval_f1_score": 0.8705157155935307,
+    "eval_gmean": 0.8715093639362524,
+    "eval_loss": 0.26869142055511475,
+    "eval_precision": 0.8726060606060605,
+    "eval_recall": 0.87,
+    "eval_runtime": 308.1312,
+    "eval_samples_per_second": 0.325,
+    "eval_steps_per_second": 0.042
 }

runs/Mar23_19-24-50_5b81996377db/events.out.tfevents.1711221893.5b81996377db.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:17b7f6ddf7da1b4c3d5ca2dbbec9ee6edf27a0f95df49e9da2f593ae094de293
+size 4897

runs/Mar23_19-25-37_5b81996377db/events.out.tfevents.1711222554.5b81996377db.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb051d3bdeadbd01f9f6b23c3a70adbb9441732a12af5659daf265b4f78b4ef1
+size 538

runs/Mar23_19-38-54_5b81996377db/events.out.tfevents.1711222735.5b81996377db.34.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c66ef2a5b80daad688e46d7f99812a91756665300a7f0211c0eec0273085fb8
+size 12485

runs/Mar23_19-38-54_5b81996377db/events.out.tfevents.1711242642.5b81996377db.34.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8cfe8a27bf8a62f29eb53c5dab4c88c26413d2838bb1da25cd5deb0ac551c6fb
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "total_flos": 1.0505428534296576e+17,
-    "train_loss": 0.370269775390625,
-    "train_runtime": 19024.4402,
-    "train_samples_per_second": 0.276,
     "train_steps_per_second": 0.004
 }

 {
     "epoch": 1.0,
     "total_flos": 1.0505428534296576e+17,
+    "train_loss": 0.3734391375285823,
+    "train_runtime": 19598.5588,
+    "train_samples_per_second": 0.268,
     "train_steps_per_second": 0.004
 }

trainer_state.json CHANGED Viewed

@@ -10,29 +10,29 @@
   "log_history": [
     {
       "epoch": 0.1,
-      "grad_norm": 5.6875,
       "learning_rate": 1.8500000000000002e-05,
-      "loss": 0.3936,
       "step": 8
     },
     {
       "epoch": 0.1,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.27302733063697815,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.7097,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.044,
       "step": 8
     },
     {
       "epoch": 0.19,
-      "grad_norm": 7.25,
       "learning_rate": 1.65e-05,
-      "loss": 0.3389,
       "step": 16
     },
     {
@@ -40,181 +40,181 @@
       "eval_accuracy": 0.87,
       "eval_f1_score": 0.8705157155935307,
       "eval_gmean": 0.8715093639362524,
-      "eval_loss": 0.2730761766433716,
       "eval_precision": 0.8726060606060605,
       "eval_recall": 0.87,
-      "eval_runtime": 298.9037,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.043,
       "step": 16
     },
     {
       "epoch": 0.29,
-      "grad_norm": 6.3125,
       "learning_rate": 1.45e-05,
-      "loss": 0.3385,
       "step": 24
     },
     {
       "epoch": 0.29,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.2719433605670929,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 299.0682,
-      "eval_samples_per_second": 0.334,
-      "eval_steps_per_second": 0.043,
       "step": 24
     },
     {
       "epoch": 0.39,
-      "grad_norm": 8.375,
       "learning_rate": 1.25e-05,
-      "loss": 0.3588,
       "step": 32
     },
     {
       "epoch": 0.39,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.27156248688697815,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.8233,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.044,
       "step": 32
     },
     {
       "epoch": 0.49,
-      "grad_norm": 7.9375,
       "learning_rate": 1.0500000000000001e-05,
-      "loss": 0.4425,
       "step": 40
     },
     {
       "epoch": 0.49,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.2713330090045929,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 299.1918,
-      "eval_samples_per_second": 0.334,
-      "eval_steps_per_second": 0.043,
       "step": 40
     },
     {
       "epoch": 0.58,
-      "grad_norm": 6.625,
       "learning_rate": 8.5e-06,
-      "loss": 0.3521,
       "step": 48
     },
     {
       "epoch": 0.58,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.271240234375,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 299.4172,
-      "eval_samples_per_second": 0.334,
-      "eval_steps_per_second": 0.043,
       "step": 48
     },
     {
       "epoch": 0.68,
-      "grad_norm": 4.875,
       "learning_rate": 6.5000000000000004e-06,
-      "loss": 0.409,
       "step": 56
     },
     {
       "epoch": 0.68,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.27153319120407104,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.9924,
-      "eval_samples_per_second": 0.334,
-      "eval_steps_per_second": 0.043,
       "step": 56
     },
     {
       "epoch": 0.78,
-      "grad_norm": 8.0,
       "learning_rate": 4.5e-06,
-      "loss": 0.3119,
       "step": 64
     },
     {
       "epoch": 0.78,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.27120116353034973,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.579,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.044,
       "step": 64
     },
     {
       "epoch": 0.88,
-      "grad_norm": 6.9375,
       "learning_rate": 2.5e-06,
-      "loss": 0.3955,
       "step": 72
     },
     {
       "epoch": 0.88,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.2712109386920929,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.6578,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.044,
       "step": 72
     },
     {
       "epoch": 0.97,
-      "grad_norm": 7.875,
       "learning_rate": 5.000000000000001e-07,
-      "loss": 0.3467,
       "step": 80
     },
     {
       "epoch": 0.97,
-      "eval_accuracy": 0.86,
-      "eval_f1_score": 0.8603998368013055,
-      "eval_gmean": 0.8596058209945328,
-      "eval_loss": 0.2712109386920929,
-      "eval_precision": 0.8614935064935065,
-      "eval_recall": 0.86,
-      "eval_runtime": 298.9474,
-      "eval_samples_per_second": 0.335,
-      "eval_steps_per_second": 0.043,
       "step": 80
     },
     {
       "epoch": 1.0,
       "step": 82,
       "total_flos": 1.0505428534296576e+17,
-      "train_loss": 0.370269775390625,
-      "train_runtime": 19024.4402,
-      "train_samples_per_second": 0.276,
       "train_steps_per_second": 0.004
     }
   ],

   "log_history": [
     {
       "epoch": 0.1,
+      "grad_norm": 6.96875,
       "learning_rate": 1.8500000000000002e-05,
+      "loss": 0.3825,
       "step": 8
     },
     {
       "epoch": 0.1,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.27127930521965027,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.2568,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 8
     },
     {
       "epoch": 0.19,
+      "grad_norm": 8.0625,
       "learning_rate": 1.65e-05,
+      "loss": 0.3684,
       "step": 16
     },
     {
       "eval_accuracy": 0.87,
       "eval_f1_score": 0.8705157155935307,
       "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.27037107944488525,
       "eval_precision": 0.8726060606060605,
       "eval_recall": 0.87,
+      "eval_runtime": 308.6792,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 16
     },
     {
       "epoch": 0.29,
+      "grad_norm": 7.1875,
       "learning_rate": 1.45e-05,
+      "loss": 0.3846,
       "step": 24
     },
     {
       "epoch": 0.29,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26976072788238525,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.4781,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 24
     },
     {
       "epoch": 0.39,
+      "grad_norm": 6.96875,
       "learning_rate": 1.25e-05,
+      "loss": 0.368,
       "step": 32
     },
     {
       "epoch": 0.39,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26942384243011475,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.2201,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 32
     },
     {
       "epoch": 0.49,
+      "grad_norm": 6.34375,
       "learning_rate": 1.0500000000000001e-05,
+      "loss": 0.3954,
       "step": 40
     },
     {
       "epoch": 0.49,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26915037631988525,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.3621,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 40
     },
     {
       "epoch": 0.58,
+      "grad_norm": 5.28125,
       "learning_rate": 8.5e-06,
+      "loss": 0.3952,
       "step": 48
     },
     {
       "epoch": 0.58,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.2691015601158142,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 307.9578,
+      "eval_samples_per_second": 0.325,
+      "eval_steps_per_second": 0.042,
       "step": 48
     },
     {
       "epoch": 0.68,
+      "grad_norm": 5.65625,
       "learning_rate": 6.5000000000000004e-06,
+      "loss": 0.368,
       "step": 56
     },
     {
       "epoch": 0.68,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.2687695324420929,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.2935,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 56
     },
     {
       "epoch": 0.78,
+      "grad_norm": 6.03125,
       "learning_rate": 4.5e-06,
+      "loss": 0.3826,
       "step": 64
     },
     {
       "epoch": 0.78,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26869142055511475,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 307.9498,
+      "eval_samples_per_second": 0.325,
+      "eval_steps_per_second": 0.042,
       "step": 64
     },
     {
       "epoch": 0.88,
+      "grad_norm": 10.0,
       "learning_rate": 2.5e-06,
+      "loss": 0.3254,
       "step": 72
     },
     {
       "epoch": 0.88,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26869142055511475,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.1218,
+      "eval_samples_per_second": 0.325,
+      "eval_steps_per_second": 0.042,
       "step": 72
     },
     {
       "epoch": 0.97,
+      "grad_norm": 8.75,
       "learning_rate": 5.000000000000001e-07,
+      "loss": 0.3547,
       "step": 80
     },
     {
       "epoch": 0.97,
+      "eval_accuracy": 0.87,
+      "eval_f1_score": 0.8705157155935307,
+      "eval_gmean": 0.8715093639362524,
+      "eval_loss": 0.26869142055511475,
+      "eval_precision": 0.8726060606060605,
+      "eval_recall": 0.87,
+      "eval_runtime": 308.2047,
+      "eval_samples_per_second": 0.324,
+      "eval_steps_per_second": 0.042,
       "step": 80
     },
     {
       "epoch": 1.0,
       "step": 82,
       "total_flos": 1.0505428534296576e+17,
+      "train_loss": 0.3734391375285823,
+      "train_runtime": 19598.5588,
+      "train_samples_per_second": 0.268,
       "train_steps_per_second": 0.004
     }
   ],