Upload folder using huggingface_hub

Files changed (7) hide show

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6108dc25ba5aa452a9c8d2e2e7d6ef2951bcb6110a3c096753940fa8b361588b
 size 160086542

 version https://git-lfs.github.com/spec/v1
+oid sha256:ea8d277e715e2a736fbe18142a6cebf1b073418e531abda67df373f2f7a44731
 size 160086542

all_results.json CHANGED Viewed

@@ -1,17 +1,17 @@
 {
-    "epoch": 0.98,
-    "eval_accuracy": 0.45,
-    "eval_f1_score": 0.413184584178499,
-    "eval_gmean": 0.43716017951820696,
-    "eval_loss": 1.7248046398162842,
-    "eval_precision": 0.42000000000000004,
-    "eval_recall": 0.45,
-    "eval_runtime": 249.5755,
-    "eval_samples_per_second": 0.321,
-    "eval_steps_per_second": 0.04,
-    "total_flos": 1.28114982125568e+16,
-    "train_loss": 1.59609375,
-    "train_runtime": 2284.6483,
-    "train_samples_per_second": 0.281,
-    "train_steps_per_second": 0.004
 }

 {
+    "epoch": 0.87,
+    "eval_accuracy": 0.5824175824175825,
+    "eval_f1_score": 0.5868882275132276,
+    "eval_gmean": 0.49316056422674454,
+    "eval_loss": 0.8609203100204468,
+    "eval_precision": 0.5918367346938775,
+    "eval_recall": 0.5824175824175825,
+    "eval_runtime": 40.3783,
+    "eval_samples_per_second": 2.254,
+    "eval_steps_per_second": 0.297,
+    "total_flos": 1701527106355200.0,
+    "train_loss": 0.9130859375,
+    "train_runtime": 390.6328,
+    "train_samples_per_second": 1.856,
+    "train_steps_per_second": 0.013
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 0.98,
-    "eval_accuracy": 0.45,
-    "eval_f1_score": 0.413184584178499,
-    "eval_gmean": 0.43716017951820696,
-    "eval_loss": 1.7248046398162842,
-    "eval_precision": 0.42000000000000004,
-    "eval_recall": 0.45,
-    "eval_runtime": 249.5755,
-    "eval_samples_per_second": 0.321,
-    "eval_steps_per_second": 0.04
 }

 {
+    "epoch": 0.87,
+    "eval_accuracy": 0.5824175824175825,
+    "eval_f1_score": 0.5868882275132276,
+    "eval_gmean": 0.49316056422674454,
+    "eval_loss": 0.8609203100204468,
+    "eval_precision": 0.5918367346938775,
+    "eval_recall": 0.5824175824175825,
+    "eval_runtime": 40.3783,
+    "eval_samples_per_second": 2.254,
+    "eval_steps_per_second": 0.297
 }

runs/Mar25_17-36-23_7eee068d60ee/events.out.tfevents.1711388186.7eee068d60ee.34.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:02850e21d1a25753baac20c56014e6034a3a85532da4d6bc2328b77019830cd5
+size 5269

runs/Mar25_17-36-23_7eee068d60ee/events.out.tfevents.1711388617.7eee068d60ee.34.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a6700ebad37c22a41e4b8f035a5742ae7b1142a07b17390f4d7cb275e734baf4
+size 605

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 0.98,
-    "total_flos": 1.28114982125568e+16,
-    "train_loss": 1.59609375,
-    "train_runtime": 2284.6483,
-    "train_samples_per_second": 0.281,
-    "train_steps_per_second": 0.004
 }

 {
+    "epoch": 0.87,
+    "total_flos": 1701527106355200.0,
+    "train_loss": 0.9130859375,
+    "train_runtime": 390.6328,
+    "train_samples_per_second": 1.856,
+    "train_steps_per_second": 0.013
 }

trainer_state.json CHANGED Viewed

@@ -1,50 +1,30 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.975609756097561,
   "eval_steps": 8,
-  "global_step": 10,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.78,
-      "grad_norm": 34.5,
-      "learning_rate": 5e-06,
-      "loss": 1.6561,
-      "step": 8
-    },
-    {
-      "epoch": 0.78,
-      "eval_accuracy": 0.45,
-      "eval_f1_score": 0.413184584178499,
-      "eval_gmean": 0.43716017951820696,
-      "eval_loss": 1.7263672351837158,
-      "eval_precision": 0.42000000000000004,
-      "eval_recall": 0.45,
-      "eval_runtime": 249.5589,
-      "eval_samples_per_second": 0.321,
-      "eval_steps_per_second": 0.04,
-      "step": 8
-    },
-    {
-      "epoch": 0.98,
-      "step": 10,
-      "total_flos": 1.28114982125568e+16,
-      "train_loss": 1.59609375,
-      "train_runtime": 2284.6483,
-      "train_samples_per_second": 0.281,
-      "train_steps_per_second": 0.004
     }
   ],
   "logging_steps": 8,
-  "max_steps": 10,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
-  "total_flos": 1.28114982125568e+16,
-  "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.8695652173913043,
   "eval_steps": 8,
+  "global_step": 5,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.87,
+      "step": 5,
+      "total_flos": 1701527106355200.0,
+      "train_loss": 0.9130859375,
+      "train_runtime": 390.6328,
+      "train_samples_per_second": 1.856,
+      "train_steps_per_second": 0.013
     }
   ],
   "logging_steps": 8,
+  "max_steps": 5,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 1,
   "save_steps": 500,
+  "total_flos": 1701527106355200.0,
+  "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null
 }