Upload folder using huggingface_hub

Browse files

Files changed (10) hide show

adapter_model.bin +1 -1
all_results.json +15 -15
eval_results.json +10 -10
runs/Apr02_19-20-35_efa31d4321fb/events.out.tfevents.1712085638.efa31d4321fb.34.0 +3 -0
runs/Apr02_19-21-06_efa31d4321fb/events.out.tfevents.1712085666.efa31d4321fb.34.1 +3 -0
runs/Apr02_19-37-16_efa31d4321fb/events.out.tfevents.1712086637.efa31d4321fb.34.2 +3 -0
runs/Apr02_19-44-05_efa31d4321fb/events.out.tfevents.1712087045.efa31d4321fb.34.3 +3 -0
runs/Apr02_19-44-05_efa31d4321fb/events.out.tfevents.1712100433.efa31d4321fb.34.4 +3 -0
train_results.json +6 -6
trainer_state.json +92 -17

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:29699d876fd85d7dc3266e0b316831faa49da847f2090d7030f99755ace6d437
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:e20f84166792753507ea6124bdd53360db24770abff12c0c1561863e51e82fd7
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 1.74,
-    "eval_accuracy": 0.8833333333333333,
-    "eval_f1_score": 0.8832360840974346,
-    "eval_gmean": 0.8848707421874868,
-    "eval_loss": 0.30425313115119934,
-    "eval_precision": 0.8875744047619049,
-    "eval_recall": 0.8833333333333333,
-    "eval_runtime": 185.7223,
-    "eval_samples_per_second": 0.323,
-    "eval_steps_per_second": 0.043,
-    "total_flos": 3303081675694080.0,
-    "train_loss": 0.85673828125,
-    "train_runtime": 699.9179,
-    "train_samples_per_second": 2.072,
-    "train_steps_per_second": 0.014
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 0.8166666666666667,
+    "eval_f1_score": 0.8149425287356322,
+    "eval_gmean": 0.7636703179128833,
+    "eval_loss": 0.3408854305744171,
+    "eval_precision": 0.8137310606060607,
+    "eval_recall": 0.8166666666666667,
+    "eval_runtime": 180.7643,
+    "eval_samples_per_second": 0.332,
+    "eval_steps_per_second": 0.044,
+    "total_flos": 8.435821078904832e+16,
+    "train_loss": 0.43565983558768656,
+    "train_runtime": 13206.8117,
+    "train_samples_per_second": 0.324,
+    "train_steps_per_second": 0.005
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 1.74,
-    "eval_accuracy": 0.8833333333333333,
-    "eval_f1_score": 0.8832360840974346,
-    "eval_gmean": 0.8848707421874868,
-    "eval_loss": 0.30425313115119934,
-    "eval_precision": 0.8875744047619049,
-    "eval_recall": 0.8833333333333333,
-    "eval_runtime": 185.7223,
-    "eval_samples_per_second": 0.323,
-    "eval_steps_per_second": 0.043
 }

 {
+    "epoch": 1.0,
+    "eval_accuracy": 0.8166666666666667,
+    "eval_f1_score": 0.8149425287356322,
+    "eval_gmean": 0.7636703179128833,
+    "eval_loss": 0.3408854305744171,
+    "eval_precision": 0.8137310606060607,
+    "eval_recall": 0.8166666666666667,
+    "eval_runtime": 180.7643,
+    "eval_samples_per_second": 0.332,
+    "eval_steps_per_second": 0.044
 }

runs/Apr02_19-20-35_efa31d4321fb/events.out.tfevents.1712085638.efa31d4321fb.34.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc7fb79e8b22ebb99fd0f80ec5ff0c18f7de311904b66d15b7f1b461c9b72ad3
+size 4982

runs/Apr02_19-21-06_efa31d4321fb/events.out.tfevents.1712085666.efa31d4321fb.34.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:37d7e8e255163325e8c9324121f58e81f5df91879ef4668571109accee66434c
+size 4982

runs/Apr02_19-37-16_efa31d4321fb/events.out.tfevents.1712086637.efa31d4321fb.34.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee6d4af75ad7725dd073c8b70f1f1c7b8fd984f6a329a18f736cdd3e253fecb9
+size 4982

runs/Apr02_19-44-05_efa31d4321fb/events.out.tfevents.1712087045.efa31d4321fb.34.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:459ca7fd3b3472443270ea8301b30309ca64105c859a9f16cb2980b5be0aa354
+size 8020

runs/Apr02_19-44-05_efa31d4321fb/events.out.tfevents.1712100433.efa31d4321fb.34.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6e92455695777ad399866e9bbf0728ea460a451ee4168208576cde132b6b0ba2
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.74,
-    "total_flos": 3303081675694080.0,
-    "train_loss": 0.85673828125,
-    "train_runtime": 699.9179,
-    "train_samples_per_second": 2.072,
-    "train_steps_per_second": 0.014
 }

 {
+    "epoch": 1.0,
+    "total_flos": 8.435821078904832e+16,
+    "train_loss": 0.43565983558768656,
+    "train_runtime": 13206.8117,
+    "train_samples_per_second": 0.324,
+    "train_steps_per_second": 0.005
 }

trainer_state.json CHANGED Viewed

@@ -1,37 +1,112 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.7391304347826086,
   "eval_steps": 28,
-  "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 1.39,
-      "grad_norm": 10.5625,
-      "learning_rate": 5e-06,
-      "loss": 0.8748,
       "step": 8
     },
     {
-      "epoch": 1.74,
-      "step": 10,
-      "total_flos": 3303081675694080.0,
-      "train_loss": 0.85673828125,
-      "train_runtime": 699.9179,
-      "train_samples_per_second": 2.072,
-      "train_steps_per_second": 0.014
     }
   ],
   "logging_steps": 8,
-  "max_steps": 10,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
-  "total_flos": 3303081675694080.0,
-  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
   "eval_steps": 28,
+  "global_step": 67,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.12,
+      "grad_norm": 13.4375,
+      "learning_rate": 1.8153846153846155e-05,
+      "loss": 0.4866,
       "step": 8
     },
     {
+      "epoch": 0.24,
+      "grad_norm": 14.5625,
+      "learning_rate": 1.5692307692307693e-05,
+      "loss": 0.4687,
+      "step": 16
+    },
+    {
+      "epoch": 0.36,
+      "grad_norm": 6.6875,
+      "learning_rate": 1.3230769230769231e-05,
+      "loss": 0.4295,
+      "step": 24
+    },
+    {
+      "epoch": 0.42,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_f1_score": 0.8149425287356322,
+      "eval_gmean": 0.7636703179128833,
+      "eval_loss": 0.3428385555744171,
+      "eval_precision": 0.8137310606060607,
+      "eval_recall": 0.8166666666666667,
+      "eval_runtime": 180.8759,
+      "eval_samples_per_second": 0.332,
+      "eval_steps_per_second": 0.044,
+      "step": 28
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 6.46875,
+      "learning_rate": 1.076923076923077e-05,
+      "loss": 0.4236,
+      "step": 32
+    },
+    {
+      "epoch": 0.6,
+      "grad_norm": 9.8125,
+      "learning_rate": 8.307692307692309e-06,
+      "loss": 0.3919,
+      "step": 40
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 13.5,
+      "learning_rate": 5.846153846153847e-06,
+      "loss": 0.4099,
+      "step": 48
+    },
+    {
+      "epoch": 0.84,
+      "grad_norm": 11.4375,
+      "learning_rate": 3.384615384615385e-06,
+      "loss": 0.4242,
+      "step": 56
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.8166666666666667,
+      "eval_f1_score": 0.8149425287356322,
+      "eval_gmean": 0.7636703179128833,
+      "eval_loss": 0.34062498807907104,
+      "eval_precision": 0.8137310606060607,
+      "eval_recall": 0.8166666666666667,
+      "eval_runtime": 180.4163,
+      "eval_samples_per_second": 0.333,
+      "eval_steps_per_second": 0.044,
+      "step": 56
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 9.3125,
+      "learning_rate": 9.230769230769232e-07,
+      "loss": 0.4092,
+      "step": 64
+    },
+    {
+      "epoch": 1.0,
+      "step": 67,
+      "total_flos": 8.435821078904832e+16,
+      "train_loss": 0.43565983558768656,
+      "train_runtime": 13206.8117,
+      "train_samples_per_second": 0.324,
+      "train_steps_per_second": 0.005
     }
   ],
   "logging_steps": 8,
+  "max_steps": 67,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 1,
   "save_steps": 500,
+  "total_flos": 8.435821078904832e+16,
+  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }