Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

adapter_model.bin +1 -1
all_results.json +15 -15
eval_results.json +10 -10
runs/Mar25_18-04-56_bf76bf365f95/events.out.tfevents.1711389899.bf76bf365f95.34.0 +3 -0
runs/Mar25_20-11-39_f542ff02488e/events.out.tfevents.1711397501.f542ff02488e.34.0 +3 -0
runs/Mar25_20-11-39_f542ff02488e/events.out.tfevents.1711426328.f542ff02488e.34.1 +3 -0
train_results.json +6 -6
trainer_state.json +229 -13

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea8d277e715e2a736fbe18142a6cebf1b073418e531abda67df373f2f7a44731
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:3f807cf91166999ea3123988f2e2b2ce66a6dad049d9f6c14b3c3202300b1673
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 0.87,
-    "eval_accuracy": 0.5824175824175825,
-    "eval_f1_score": 0.5868882275132276,
-    "eval_gmean": 0.49316056422674454,
-    "eval_loss": 0.8609203100204468,
-    "eval_precision": 0.5918367346938775,
-    "eval_recall": 0.5824175824175825,
-    "eval_runtime": 40.3783,
-    "eval_samples_per_second": 2.254,
-    "eval_steps_per_second": 0.297,
-    "total_flos": 1701527106355200.0,
-    "train_loss": 0.9130859375,
-    "train_runtime": 390.6328,
-    "train_samples_per_second": 1.856,
-    "train_steps_per_second": 0.013
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 0.78,
+    "eval_f1_score": 0.7785897435897436,
+    "eval_gmean": 0.7961000720231877,
+    "eval_loss": 0.5531054735183716,
+    "eval_precision": 0.8186666666666668,
+    "eval_recall": 0.78,
+    "eval_runtime": 273.9816,
+    "eval_samples_per_second": 0.365,
+    "eval_steps_per_second": 0.047,
+    "total_flos": 1.6845278653034496e+17,
+    "train_loss": 0.7047583736590485,
+    "train_runtime": 28553.3073,
+    "train_samples_per_second": 0.3,
+    "train_steps_per_second": 0.005
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 0.87,
-    "eval_accuracy": 0.5824175824175825,
-    "eval_f1_score": 0.5868882275132276,
-    "eval_gmean": 0.49316056422674454,
-    "eval_loss": 0.8609203100204468,
-    "eval_precision": 0.5918367346938775,
-    "eval_recall": 0.5824175824175825,
-    "eval_runtime": 40.3783,
-    "eval_samples_per_second": 2.254,
-    "eval_steps_per_second": 0.297
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 0.78,
+    "eval_f1_score": 0.7785897435897436,
+    "eval_gmean": 0.7961000720231877,
+    "eval_loss": 0.5531054735183716,
+    "eval_precision": 0.8186666666666668,
+    "eval_recall": 0.78,
+    "eval_runtime": 273.9816,
+    "eval_samples_per_second": 0.365,
+    "eval_steps_per_second": 0.047
 }

runs/Mar25_18-04-56_bf76bf365f95/events.out.tfevents.1711389899.bf76bf365f95.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33cd72fb9d13a78dde70e74225946888a01961b1b5cdc6c03af22a06b2af7c8d
+size 5873

runs/Mar25_20-11-39_f542ff02488e/events.out.tfevents.1711397501.f542ff02488e.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41624f153ce1ae2dd0d5edcd1f31cad0b2835060bf26664f448e80caebf9db06
+size 12759

runs/Mar25_20-11-39_f542ff02488e/events.out.tfevents.1711426328.f542ff02488e.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:088cc617217456fe0310d4d222532846befd09b65f5796f4e83615c712ebdda8
+size 615

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 0.87,
-    "total_flos": 1701527106355200.0,
-    "train_loss": 0.9130859375,
-    "train_runtime": 390.6328,
-    "train_samples_per_second": 1.856,
-    "train_steps_per_second": 0.013
 }

 {
+    "epoch": 1.0,
+    "total_flos": 1.6845278653034496e+17,
+    "train_loss": 0.7047583736590485,
+    "train_runtime": 28553.3073,
+    "train_samples_per_second": 0.3,
+    "train_steps_per_second": 0.005
 }

trainer_state.json CHANGED Viewed

@@ -1,30 +1,246 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.8695652173913043,
-  "eval_steps": 8,
-  "global_step": 5,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.87,
-      "step": 5,
-      "total_flos": 1701527106355200.0,
-      "train_loss": 0.9130859375,
-      "train_runtime": 390.6328,
-      "train_samples_per_second": 1.856,
-      "train_steps_per_second": 0.013
     }
   ],
   "logging_steps": 8,
-  "max_steps": 5,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 1701527106355200.0,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 16,
+  "global_step": 134,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.06,
+      "grad_norm": 53.25,
+      "learning_rate": 1.9090909090909094e-05,
+      "loss": 1.1167,
+      "step": 8
+    },
+    {
+      "epoch": 0.12,
+      "grad_norm": 44.5,
+      "learning_rate": 1.787878787878788e-05,
+      "loss": 0.895,
+      "step": 16
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.66,
+      "eval_f1_score": 0.644367816091954,
+      "eval_gmean": 0.6885077030381411,
+      "eval_loss": 0.8683984279632568,
+      "eval_precision": 0.7505555555555555,
+      "eval_recall": 0.66,
+      "eval_runtime": 272.9997,
+      "eval_samples_per_second": 0.366,
+      "eval_steps_per_second": 0.048,
+      "step": 16
+    },
+    {
+      "epoch": 0.18,
+      "grad_norm": 46.5,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 0.829,
+      "step": 24
+    },
+    {
+      "epoch": 0.24,
+      "grad_norm": 30.875,
+      "learning_rate": 1.5454545454545454e-05,
+      "loss": 0.747,
+      "step": 32
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.72,
+      "eval_f1_score": 0.7137777777777776,
+      "eval_gmean": 0.7423479773532891,
+      "eval_loss": 0.7020312547683716,
+      "eval_precision": 0.783921568627451,
+      "eval_recall": 0.72,
+      "eval_runtime": 273.193,
+      "eval_samples_per_second": 0.366,
+      "eval_steps_per_second": 0.048,
+      "step": 32
+    },
+    {
+      "epoch": 0.3,
+      "grad_norm": 29.375,
+      "learning_rate": 1.4242424242424245e-05,
+      "loss": 0.7173,
+      "step": 40
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 28.875,
+      "learning_rate": 1.3030303030303032e-05,
+      "loss": 0.7169,
+      "step": 48
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.74,
+      "eval_f1_score": 0.7358132045088567,
+      "eval_gmean": 0.7602742157385604,
+      "eval_loss": 0.6424999833106995,
+      "eval_precision": 0.7952083333333333,
+      "eval_recall": 0.74,
+      "eval_runtime": 273.7345,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.047,
+      "step": 48
+    },
+    {
+      "epoch": 0.42,
+      "grad_norm": 32.25,
+      "learning_rate": 1.181818181818182e-05,
+      "loss": 0.6892,
+      "step": 56
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 35.25,
+      "learning_rate": 1.0606060606060606e-05,
+      "loss": 0.7526,
+      "step": 64
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.77,
+      "eval_f1_score": 0.7680401002506266,
+      "eval_gmean": 0.7871467461661771,
+      "eval_loss": 0.6016992330551147,
+      "eval_precision": 0.8126607818411097,
+      "eval_recall": 0.77,
+      "eval_runtime": 274.3064,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.047,
+      "step": 64
+    },
+    {
+      "epoch": 0.54,
+      "grad_norm": 28.875,
+      "learning_rate": 9.393939393939396e-06,
+      "loss": 0.6553,
+      "step": 72
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 25.625,
+      "learning_rate": 8.181818181818183e-06,
+      "loss": 0.5781,
+      "step": 80
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.78,
+      "eval_f1_score": 0.7785897435897436,
+      "eval_gmean": 0.7961000720231877,
+      "eval_loss": 0.5736328363418579,
+      "eval_precision": 0.8186666666666668,
+      "eval_recall": 0.78,
+      "eval_runtime": 273.4905,
+      "eval_samples_per_second": 0.366,
+      "eval_steps_per_second": 0.048,
+      "step": 80
+    },
+    {
+      "epoch": 0.66,
+      "grad_norm": 16.5,
+      "learning_rate": 6.969696969696971e-06,
+      "loss": 0.56,
+      "step": 88
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 32.5,
+      "learning_rate": 5.7575757575757586e-06,
+      "loss": 0.6035,
+      "step": 96
+    },
+    {
+      "epoch": 0.72,
+      "eval_accuracy": 0.78,
+      "eval_f1_score": 0.7785897435897436,
+      "eval_gmean": 0.7961000720231877,
+      "eval_loss": 0.5596484541893005,
+      "eval_precision": 0.8186666666666668,
+      "eval_recall": 0.78,
+      "eval_runtime": 273.6048,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.048,
+      "step": 96
+    },
+    {
+      "epoch": 0.78,
+      "grad_norm": 24.0,
+      "learning_rate": 4.5454545454545455e-06,
+      "loss": 0.6456,
+      "step": 104
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 34.75,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 0.655,
+      "step": 112
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.78,
+      "eval_f1_score": 0.7785897435897436,
+      "eval_gmean": 0.7961000720231877,
+      "eval_loss": 0.5552539229393005,
+      "eval_precision": 0.8186666666666668,
+      "eval_recall": 0.78,
+      "eval_runtime": 273.6051,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.048,
+      "step": 112
+    },
+    {
+      "epoch": 0.9,
+      "grad_norm": 25.625,
+      "learning_rate": 2.1212121212121216e-06,
+      "loss": 0.5464,
+      "step": 120
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 16.625,
+      "learning_rate": 9.090909090909091e-07,
+      "loss": 0.606,
+      "step": 128
+    },
+    {
+      "epoch": 0.96,
+      "eval_accuracy": 0.78,
+      "eval_f1_score": 0.7785897435897436,
+      "eval_gmean": 0.7961000720231877,
+      "eval_loss": 0.5531054735183716,
+      "eval_precision": 0.8186666666666668,
+      "eval_recall": 0.78,
+      "eval_runtime": 273.8068,
+      "eval_samples_per_second": 0.365,
+      "eval_steps_per_second": 0.047,
+      "step": 128
+    },
+    {
+      "epoch": 1.0,
+      "step": 134,
+      "total_flos": 1.6845278653034496e+17,
+      "train_loss": 0.7047583736590485,
+      "train_runtime": 28553.3073,
+      "train_samples_per_second": 0.3,
+      "train_steps_per_second": 0.005
     }
   ],
   "logging_steps": 8,
+  "max_steps": 134,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
+  "total_flos": 1.6845278653034496e+17,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }