Upload folder using huggingface_hub

Files changed (7) hide show

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab078ca42c5033790a59a7d1b8ea5cb025038f8778b8bb368725c814de1dcb99
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:29699d876fd85d7dc3266e0b316831faa49da847f2090d7030f99755ace6d437
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 1.95,
-    "eval_accuracy": 0.85,
-    "eval_f1_score": 0.8512605042016806,
-    "eval_gmean": 0.8238099238888024,
-    "eval_loss": 0.35761719942092896,
-    "eval_precision": 0.853042328042328,
-    "eval_recall": 0.85,
-    "eval_runtime": 183.8915,
-    "eval_samples_per_second": 0.326,
-    "eval_steps_per_second": 0.044,
-    "total_flos": 2.536276286767104e+16,
-    "train_loss": 2.198583984375,
-    "train_runtime": 3976.3696,
-    "train_samples_per_second": 0.323,
-    "train_steps_per_second": 0.005
 }

 {
+    "epoch": 1.74,
+    "eval_accuracy": 0.8833333333333333,
+    "eval_f1_score": 0.8832360840974346,
+    "eval_gmean": 0.8848707421874868,
+    "eval_loss": 0.30425313115119934,
+    "eval_precision": 0.8875744047619049,
+    "eval_recall": 0.8833333333333333,
+    "eval_runtime": 185.7223,
+    "eval_samples_per_second": 0.323,
+    "eval_steps_per_second": 0.043,
+    "total_flos": 3303081675694080.0,
+    "train_loss": 0.85673828125,
+    "train_runtime": 699.9179,
+    "train_samples_per_second": 2.072,
+    "train_steps_per_second": 0.014
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 1.95,
-    "eval_accuracy": 0.85,
-    "eval_f1_score": 0.8512605042016806,
-    "eval_gmean": 0.8238099238888024,
-    "eval_loss": 0.35761719942092896,
-    "eval_precision": 0.853042328042328,
-    "eval_recall": 0.85,
-    "eval_runtime": 183.8915,
-    "eval_samples_per_second": 0.326,
-    "eval_steps_per_second": 0.044
 }

 {
+    "epoch": 1.74,
+    "eval_accuracy": 0.8833333333333333,
+    "eval_f1_score": 0.8832360840974346,
+    "eval_gmean": 0.8848707421874868,
+    "eval_loss": 0.30425313115119934,
+    "eval_precision": 0.8875744047619049,
+    "eval_recall": 0.8833333333333333,
+    "eval_runtime": 185.7223,
+    "eval_samples_per_second": 0.323,
+    "eval_steps_per_second": 0.043
 }

runs/Apr02_18-52-22_63123e2dced6/events.out.tfevents.1712083944.63123e2dced6.34.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7396e2595b34b29882569be494d2d21b48010bcff7a87e855875060f34e1c4b0
+size 5537

runs/Apr02_18-52-22_63123e2dced6/events.out.tfevents.1712084829.63123e2dced6.34.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c393740750d1682ddeb06fe23cecaa8cbd52b21559ddde066d9bf929e0ce391
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.95,
-    "total_flos": 2.536276286767104e+16,
-    "train_loss": 2.198583984375,
-    "train_runtime": 3976.3696,
-    "train_samples_per_second": 0.323,
-    "train_steps_per_second": 0.005
 }

 {
+    "epoch": 1.74,
+    "total_flos": 3303081675694080.0,
+    "train_loss": 0.85673828125,
+    "train_runtime": 699.9179,
+    "train_samples_per_second": 2.072,
+    "train_steps_per_second": 0.014
 }

trainer_state.json CHANGED Viewed

@@ -1,44 +1,37 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.951219512195122,
   "eval_steps": 28,
-  "global_step": 20,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.78,
-      "grad_norm": 39.25,
-      "learning_rate": 1.3333333333333333e-05,
-      "loss": 2.3276,
       "step": 8
     },
     {
-      "epoch": 1.56,
-      "grad_norm": 25.75,
-      "learning_rate": 4.444444444444444e-06,
-      "loss": 1.9921,
-      "step": 16
-    },
-    {
-      "epoch": 1.95,
-      "step": 20,
-      "total_flos": 2.536276286767104e+16,
-      "train_loss": 2.198583984375,
-      "train_runtime": 3976.3696,
-      "train_samples_per_second": 0.323,
-      "train_steps_per_second": 0.005
     }
   ],
   "logging_steps": 8,
-  "max_steps": 20,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 2,
   "save_steps": 500,
-  "total_flos": 2.536276286767104e+16,
-  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.7391304347826086,
   "eval_steps": 28,
+  "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.39,
+      "grad_norm": 10.5625,
+      "learning_rate": 5e-06,
+      "loss": 0.8748,
       "step": 8
     },
     {
+      "epoch": 1.74,
+      "step": 10,
+      "total_flos": 3303081675694080.0,
+      "train_loss": 0.85673828125,
+      "train_runtime": 699.9179,
+      "train_samples_per_second": 2.072,
+      "train_steps_per_second": 0.014
     }
   ],
   "logging_steps": 8,
+  "max_steps": 10,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 2,
   "save_steps": 500,
+  "total_flos": 3303081675694080.0,
+  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }