Upload 12 files

Files changed (5) hide show

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5f04940d191d5116d1cdb84fb958d626c7cb6fe3561cc4e4a2aa5ef8b7c7b6ea
 size 1115283588

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef88acd7b940c0a42e85cb82aad1441811e9cad6a2a30dbe70b1e6dfd39899d4
 size 1115283588

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:685362a4e376c51d038de9536e01e7b5d486c3f469024975b5800d12f1d7d16a
 size 2230686277

 version https://git-lfs.github.com/spec/v1
+oid sha256:e95ab3a0e177ebef1a730ea6c25411246adf47a11f94abb1102b76fae92c729a
 size 2230686277

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:42cd100366657e056c44ccf9126d34c08c902f596b2532bee723c91bd3220fa0
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:de71cb290b64bc136ac49050f7bce13d74391577dd275bda3c8142bd03f8bfb1
 size 14575

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d157d941cae3d6318e2b951c2b5e3f17b9c66893c4c246690a1e90c216a8558f
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b6716fb4bc72b67621113830aa02a129248ffd9a4100203fff469ffeaeccbf5
 size 627

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 1.9327729940414429,
   "best_model_checkpoint": "./results/checkpoint-322",
-  "epoch": 14.0,
   "eval_steps": 500,
-  "global_step": 4508,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -215,6 +215,34 @@
       "eval_samples_per_second": 91.676,
       "eval_steps_per_second": 0.464,
       "step": 4508
     }
   ],
   "logging_steps": 500,
@@ -222,7 +250,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
-  "total_flos": 2.3718794212945306e+17,
   "train_batch_size": 200,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 1.9327729940414429,
   "best_model_checkpoint": "./results/checkpoint-322",
+  "epoch": 16.0,
   "eval_steps": 500,
+  "global_step": 5152,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 91.676,
       "eval_steps_per_second": 0.464,
       "step": 4508
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.33707370737073705,
+      "eval_loss": 5.8459153175354,
+      "eval_precision": 0.3366756679639873,
+      "eval_recall": 0.33707370737073705,
+      "eval_runtime": 100.8652,
+      "eval_samples_per_second": 90.12,
+      "eval_steps_per_second": 0.456,
+      "step": 4830
+    },
+    {
+      "epoch": 15.53,
+      "learning_rate": 6.894409937888199e-05,
+      "loss": 0.0243,
+      "step": 5000
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.35401540154015404,
+      "eval_loss": 5.645482540130615,
+      "eval_precision": 0.3631233149571772,
+      "eval_recall": 0.35401540154015404,
+      "eval_runtime": 99.6631,
+      "eval_samples_per_second": 91.207,
+      "eval_steps_per_second": 0.462,
+      "step": 5152
     }
   ],
   "logging_steps": 500,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 50,
   "save_steps": 500,
+  "total_flos": 2.7107193386223206e+17,
   "train_batch_size": 200,
   "trial_name": null,
   "trial_params": null