Training in progress, epoch 6

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-27-58_ubuntu-2004/events.out.tfevents.1676885321.ubuntu-2004.886785.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22087826d4ba83ff43aa92646474a7d738bab2dd63e2f35df5258bba24feb37a
 size 236470789

 version https://git-lfs.github.com/spec/v1
+oid sha256:27f3648a6badaba6668f8c6d4db4c2b9896ababb988525769298b2731863da37
 size 236470789

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a700a014c14e45bba7ac4d9c3addf426338c4babdc7d46b58792c086a371be15
 size 118243218

 version https://git-lfs.github.com/spec/v1
+oid sha256:c3d71c32019041a99199225d8bb52225cec92c140618e167aad1e1ccb4d0d934
 size 118243218

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c826109d4f8c0572f569da300df250d13a18926f54ce1fa15e1b255c8c485c19
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce5c3856f1342734c9ff443026f78f9d74949332f5c5b796847ea499dbf0c080
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8745b7d4dcff3c828a3250fc0904c3946b34c082c34c9ff77e31f739752a438
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:b278cd6e09360f31a3d837f80dee4c2ce4d9c9d186a939ecf157e1a0deb793f3
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:709c9f3a894f05e4848baff4ab73816348c18f139d1395092b46622df0fe9bf1
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1f64a9b985406894ef65cdb08cec8746d6a7f750e0466984f5ddbc1f0df99b9
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.0,
-  "global_step": 114700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1425,11 +1425,296 @@
       "eval_samples_per_second": 496.191,
       "eval_steps_per_second": 31.012,
       "step": 114700
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 8.678421440109158e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.0,
+  "global_step": 137640,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 496.191,
       "eval_steps_per_second": 31.012,
       "step": 114700
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 6.485651741794256e-05,
+      "loss": 1.9898,
+      "step": 115000
+    },
+    {
+      "epoch": 5.03,
+      "learning_rate": 6.469957351516601e-05,
+      "loss": 1.988,
+      "step": 115500
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 6.454231509555022e-05,
+      "loss": 1.9881,
+      "step": 116000
+    },
+    {
+      "epoch": 5.08,
+      "learning_rate": 6.438505667593443e-05,
+      "loss": 1.9849,
+      "step": 116500
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 6.422779825631865e-05,
+      "loss": 1.9872,
+      "step": 117000
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 6.407085435354208e-05,
+      "loss": 1.9834,
+      "step": 117500
+    },
+    {
+      "epoch": 5.14,
+      "learning_rate": 6.391359593392631e-05,
+      "loss": 1.9814,
+      "step": 118000
+    },
+    {
+      "epoch": 5.17,
+      "learning_rate": 6.375633751431052e-05,
+      "loss": 1.978,
+      "step": 118500
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 6.359907909469474e-05,
+      "loss": 1.9857,
+      "step": 119000
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 6.344213519191819e-05,
+      "loss": 1.9816,
+      "step": 119500
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 6.32848767723024e-05,
+      "loss": 1.9817,
+      "step": 120000
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 6.312761835268661e-05,
+      "loss": 1.9815,
+      "step": 120500
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 6.297035993307082e-05,
+      "loss": 1.9796,
+      "step": 121000
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 6.281341603029426e-05,
+      "loss": 1.9842,
+      "step": 121500
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 6.265615761067847e-05,
+      "loss": 1.9816,
+      "step": 122000
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 6.249889919106268e-05,
+      "loss": 1.976,
+      "step": 122500
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 6.234164077144691e-05,
+      "loss": 1.9798,
+      "step": 123000
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 6.218469686867035e-05,
+      "loss": 1.9768,
+      "step": 123500
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 6.202743844905456e-05,
+      "loss": 1.9786,
+      "step": 124000
+    },
+    {
+      "epoch": 5.43,
+      "learning_rate": 6.187018002943879e-05,
+      "loss": 1.9753,
+      "step": 124500
+    },
+    {
+      "epoch": 5.45,
+      "learning_rate": 6.1712921609823e-05,
+      "loss": 1.9755,
+      "step": 125000
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 6.155597770704644e-05,
+      "loss": 1.9771,
+      "step": 125500
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 6.139871928743065e-05,
+      "loss": 1.9736,
+      "step": 126000
+    },
+    {
+      "epoch": 5.51,
+      "learning_rate": 6.124146086781488e-05,
+      "loss": 1.9729,
+      "step": 126500
+    },
+    {
+      "epoch": 5.54,
+      "learning_rate": 6.108420244819907e-05,
+      "loss": 1.9692,
+      "step": 127000
+    },
+    {
+      "epoch": 5.56,
+      "learning_rate": 6.0927258545422526e-05,
+      "loss": 1.9702,
+      "step": 127500
+    },
+    {
+      "epoch": 5.58,
+      "learning_rate": 6.077000012580674e-05,
+      "loss": 1.9709,
+      "step": 128000
+    },
+    {
+      "epoch": 5.6,
+      "learning_rate": 6.0612741706190954e-05,
+      "loss": 1.9712,
+      "step": 128500
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 6.0455483286575164e-05,
+      "loss": 1.9714,
+      "step": 129000
+    },
+    {
+      "epoch": 5.65,
+      "learning_rate": 6.0298539383798616e-05,
+      "loss": 1.9736,
+      "step": 129500
+    },
+    {
+      "epoch": 5.67,
+      "learning_rate": 6.014128096418282e-05,
+      "loss": 1.9677,
+      "step": 130000
+    },
+    {
+      "epoch": 5.69,
+      "learning_rate": 5.9984022544567044e-05,
+      "loss": 1.9626,
+      "step": 130500
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 5.9826764124951254e-05,
+      "loss": 1.966,
+      "step": 131000
+    },
+    {
+      "epoch": 5.73,
+      "learning_rate": 5.96698202221747e-05,
+      "loss": 1.9626,
+      "step": 131500
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 5.951256180255891e-05,
+      "loss": 1.9652,
+      "step": 132000
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 5.935530338294313e-05,
+      "loss": 1.9652,
+      "step": 132500
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 5.919804496332734e-05,
+      "loss": 1.9638,
+      "step": 133000
+    },
+    {
+      "epoch": 5.82,
+      "learning_rate": 5.9040786543711554e-05,
+      "loss": 1.9591,
+      "step": 133500
+    },
+    {
+      "epoch": 5.84,
+      "learning_rate": 5.888384264093499e-05,
+      "loss": 1.9648,
+      "step": 134000
+    },
+    {
+      "epoch": 5.86,
+      "learning_rate": 5.872658422131922e-05,
+      "loss": 1.9617,
+      "step": 134500
+    },
+    {
+      "epoch": 5.88,
+      "learning_rate": 5.856932580170342e-05,
+      "loss": 1.9626,
+      "step": 135000
+    },
+    {
+      "epoch": 5.91,
+      "learning_rate": 5.8412067382087644e-05,
+      "loss": 1.9597,
+      "step": 135500
+    },
+    {
+      "epoch": 5.93,
+      "learning_rate": 5.825512347931108e-05,
+      "loss": 1.9597,
+      "step": 136000
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 5.80978650596953e-05,
+      "loss": 1.962,
+      "step": 136500
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 5.794060664007951e-05,
+      "loss": 1.9557,
+      "step": 137000
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 5.778334822046373e-05,
+      "loss": 1.9576,
+      "step": 137500
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.6267606171222161,
+      "eval_loss": 1.8356587886810303,
+      "eval_runtime": 358.323,
+      "eval_samples_per_second": 496.625,
+      "eval_steps_per_second": 31.039,
+      "step": 137640
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 1.041429725631959e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a700a014c14e45bba7ac4d9c3addf426338c4babdc7d46b58792c086a371be15
 size 118243218

 version https://git-lfs.github.com/spec/v1
+oid sha256:c3d71c32019041a99199225d8bb52225cec92c140618e167aad1e1ccb4d0d934
 size 118243218

runs/Feb20_18-27-58_ubuntu-2004/events.out.tfevents.1676885321.ubuntu-2004.886785.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cecb95435b971ee3e9da76c61cbc5907364083429abba73e46350de6431f6ee5
-size 41941

 version https://git-lfs.github.com/spec/v1
+oid sha256:421928b94b23f10aa10b0c399afa84e783ed1e8b949a4822fbce947b89041721
+size 49630