Training in progress, step 3777, checkpoint

Files changed (5) hide show

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6ce8db3b80b514dfc4ccc29780f43167e58029c6a67f1eedcd01394432d973f3
 size 167832240

 version https://git-lfs.github.com/spec/v1
+oid sha256:aeebe368eb77dd59cf57cb7a1b09ab7881a8f38ef8de181557db15cf97d42441
 size 167832240

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3fdc53e6c9642effed8e2b20df3f515014c09b49e83e9f25857d6f6d1f8093af
 size 86889891

 version https://git-lfs.github.com/spec/v1
+oid sha256:039da929b0ca180eaab116edb95a88fb7a04c32d7bb303a925acb2888070e3db
 size 86889891

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d8442b89362d2c3fbed2fee68ab46959b16e3fd21869c5ae0404708bec56f99
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:da045893976d7c4c0ba8ca84a12e3e9267728c64cb1f32b0a7d0c4ce534e9b41
 size 14645

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6395afb35e81be08b45cc18b63967699db3df58005600a6b5e324106137067a9
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1b5437befb4c77d45008b3f81b9423bd9d0c30e716b16b4c2d0d1391cd39be1
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 0.5443456768989563,
   "best_model_checkpoint": "./learnhub-checkpoints/checkpoint-2500",
-  "epoch": 2.937493798987995,
   "eval_steps": 100,
-  "global_step": 3700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1339,6 +1339,27 @@
       "eval_samples_per_second": 1.337,
       "eval_steps_per_second": 0.669,
       "step": 3700
     }
   ],
   "logging_steps": 25,
@@ -1353,12 +1374,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 3.636828326257459e+17,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": 0.5443456768989563,
   "best_model_checkpoint": "./learnhub-checkpoints/checkpoint-2500",
+  "epoch": 2.9986109733108446,
   "eval_steps": 100,
+  "global_step": 3777,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 1.337,
       "eval_steps_per_second": 0.669,
       "step": 3700
+    },
+    {
+      "epoch": 2.9573370374045043,
+      "grad_norm": 10.888229370117188,
+      "learning_rate": 9.867740937795634e-08,
+      "loss": 1.9724,
+      "step": 3725
+    },
+    {
+      "epoch": 2.9771802758210137,
+      "grad_norm": 14.896629333496094,
+      "learning_rate": 2.660668443794645e-08,
+      "loss": 1.9815,
+      "step": 3750
+    },
+    {
+      "epoch": 2.9970235142375237,
+      "grad_norm": 11.675270080566406,
+      "learning_rate": 1.4599647685242802e-10,
+      "loss": 1.9008,
+      "step": 3775
     }
   ],
   "logging_steps": 25,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 3.7131039722038886e+17,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null