Training in progress, epoch 7

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3c204c5739cb89e423854dc482b604d68f1fe7777bddd32bee3e42c27396f835
 size 236491269

 version https://git-lfs.github.com/spec/v1
+oid sha256:a49ec4140754981eb351649fecf5d3e3d44b0e29fa9e01bf8460a2dcc5b91392
 size 236491269

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f1368949b8a3ca0194b62ba5c01ad414ec8388ceb72de5c960a6415ef0bc7eb
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:acc77a725d52d6e34c7f61d7c679e4c1b46be2370324f266e5a1ff1d1bebc2bf
 size 118253458

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b2804a769785bd005d311fa5211b59d4c5e43c5e9f11eb9bdc8f5d8e3bbbcfcc
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:2593a21d27b6d3490c2b6104d1f46ccef142af342ac4030549c5bf8e21edca72
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:249568bbffd1228f6946ea7e8e37b3e1003da8fddc10b6cbe9e7db83b6052d3f
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:74546aa0cb21fe7508cf9d0a3ed65e894eded209c32829312f983360c4339967
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b1f64a9b985406894ef65cdb08cec8746d6a7f750e0466984f5ddbc1f0df99b9
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:1981182cf21e486b0f1de0f86d848f914d636f6e137316378a492b50ad1a4d9c
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 6.0,
-  "global_step": 137640,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1710,11 +1710,296 @@
       "eval_samples_per_second": 603.291,
       "eval_steps_per_second": 37.706,
       "step": 137640
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 1.0465574145188712e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 7.0,
+  "global_step": 160580,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 603.291,
       "eval_steps_per_second": 37.706,
       "step": 137640
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 5.762640431768718e-05,
+      "loss": 1.6789,
+      "step": 138000
+    },
+    {
+      "epoch": 6.04,
+      "learning_rate": 5.746946041491061e-05,
+      "loss": 1.6869,
+      "step": 138500
+    },
+    {
+      "epoch": 6.06,
+      "learning_rate": 5.7312201995294836e-05,
+      "loss": 1.6766,
+      "step": 139000
+    },
+    {
+      "epoch": 6.08,
+      "learning_rate": 5.7154943575679046e-05,
+      "loss": 1.6819,
+      "step": 139500
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 5.699768515606326e-05,
+      "loss": 1.6812,
+      "step": 140000
+    },
+    {
+      "epoch": 6.12,
+      "learning_rate": 5.68407412532867e-05,
+      "loss": 1.6802,
+      "step": 140500
+    },
+    {
+      "epoch": 6.15,
+      "learning_rate": 5.668348283367092e-05,
+      "loss": 1.6788,
+      "step": 141000
+    },
+    {
+      "epoch": 6.17,
+      "learning_rate": 5.652622441405513e-05,
+      "loss": 1.6786,
+      "step": 141500
+    },
+    {
+      "epoch": 6.19,
+      "learning_rate": 5.6368965994439346e-05,
+      "loss": 1.6798,
+      "step": 142000
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 5.6212022091662785e-05,
+      "loss": 1.6758,
+      "step": 142500
+    },
+    {
+      "epoch": 6.23,
+      "learning_rate": 5.605476367204701e-05,
+      "loss": 1.6775,
+      "step": 143000
+    },
+    {
+      "epoch": 6.26,
+      "learning_rate": 5.589750525243121e-05,
+      "loss": 1.6764,
+      "step": 143500
+    },
+    {
+      "epoch": 6.28,
+      "learning_rate": 5.5740246832815436e-05,
+      "loss": 1.6735,
+      "step": 144000
+    },
+    {
+      "epoch": 6.3,
+      "learning_rate": 5.5583302930038875e-05,
+      "loss": 1.6758,
+      "step": 144500
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 5.542604451042309e-05,
+      "loss": 1.6746,
+      "step": 145000
+    },
+    {
+      "epoch": 6.34,
+      "learning_rate": 5.52687860908073e-05,
+      "loss": 1.678,
+      "step": 145500
+    },
+    {
+      "epoch": 6.36,
+      "learning_rate": 5.511152767119152e-05,
+      "loss": 1.6724,
+      "step": 146000
+    },
+    {
+      "epoch": 6.39,
+      "learning_rate": 5.495458376841497e-05,
+      "loss": 1.6727,
+      "step": 146500
+    },
+    {
+      "epoch": 6.41,
+      "learning_rate": 5.4797325348799175e-05,
+      "loss": 1.6726,
+      "step": 147000
+    },
+    {
+      "epoch": 6.43,
+      "learning_rate": 5.4640066929183386e-05,
+      "loss": 1.6726,
+      "step": 147500
+    },
+    {
+      "epoch": 6.45,
+      "learning_rate": 5.448280850956761e-05,
+      "loss": 1.6735,
+      "step": 148000
+    },
+    {
+      "epoch": 6.47,
+      "learning_rate": 5.4325864606791055e-05,
+      "loss": 1.6722,
+      "step": 148500
+    },
+    {
+      "epoch": 6.5,
+      "learning_rate": 5.4168606187175265e-05,
+      "loss": 1.6672,
+      "step": 149000
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 5.4011347767559475e-05,
+      "loss": 1.6716,
+      "step": 149500
+    },
+    {
+      "epoch": 6.54,
+      "learning_rate": 5.385408934794369e-05,
+      "loss": 1.6746,
+      "step": 150000
+    },
+    {
+      "epoch": 6.56,
+      "learning_rate": 5.369714544516714e-05,
+      "loss": 1.6714,
+      "step": 150500
+    },
+    {
+      "epoch": 6.58,
+      "learning_rate": 5.353988702555135e-05,
+      "loss": 1.6631,
+      "step": 151000
+    },
+    {
+      "epoch": 6.6,
+      "learning_rate": 5.338262860593557e-05,
+      "loss": 1.667,
+      "step": 151500
+    },
+    {
+      "epoch": 6.63,
+      "learning_rate": 5.3225370186319776e-05,
+      "loss": 1.6716,
+      "step": 152000
+    },
+    {
+      "epoch": 6.65,
+      "learning_rate": 5.306842628354323e-05,
+      "loss": 1.6653,
+      "step": 152500
+    },
+    {
+      "epoch": 6.67,
+      "learning_rate": 5.291116786392744e-05,
+      "loss": 1.6648,
+      "step": 153000
+    },
+    {
+      "epoch": 6.69,
+      "learning_rate": 5.2753909444311655e-05,
+      "loss": 1.6645,
+      "step": 153500
+    },
+    {
+      "epoch": 6.71,
+      "learning_rate": 5.2596651024695866e-05,
+      "loss": 1.6682,
+      "step": 154000
+    },
+    {
+      "epoch": 6.73,
+      "learning_rate": 5.243970712191931e-05,
+      "loss": 1.6631,
+      "step": 154500
+    },
+    {
+      "epoch": 6.76,
+      "learning_rate": 5.228244870230352e-05,
+      "loss": 1.6637,
+      "step": 155000
+    },
+    {
+      "epoch": 6.78,
+      "learning_rate": 5.212519028268774e-05,
+      "loss": 1.664,
+      "step": 155500
+    },
+    {
+      "epoch": 6.8,
+      "learning_rate": 5.196793186307195e-05,
+      "loss": 1.6665,
+      "step": 156000
+    },
+    {
+      "epoch": 6.82,
+      "learning_rate": 5.18109879602954e-05,
+      "loss": 1.6624,
+      "step": 156500
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 5.1653729540679605e-05,
+      "loss": 1.6611,
+      "step": 157000
+    },
+    {
+      "epoch": 6.87,
+      "learning_rate": 5.149647112106383e-05,
+      "loss": 1.6642,
+      "step": 157500
+    },
+    {
+      "epoch": 6.89,
+      "learning_rate": 5.133921270144804e-05,
+      "loss": 1.6595,
+      "step": 158000
+    },
+    {
+      "epoch": 6.91,
+      "learning_rate": 5.1182268798671485e-05,
+      "loss": 1.6607,
+      "step": 158500
+    },
+    {
+      "epoch": 6.93,
+      "learning_rate": 5.1025010379055695e-05,
+      "loss": 1.663,
+      "step": 159000
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 5.086775195943991e-05,
+      "loss": 1.6598,
+      "step": 159500
+    },
+    {
+      "epoch": 6.97,
+      "learning_rate": 5.071049353982412e-05,
+      "loss": 1.662,
+      "step": 160000
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 5.055354963704757e-05,
+      "loss": 1.658,
+      "step": 160500
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.681177174568378,
+      "eval_loss": 1.5331339836120605,
+      "eval_runtime": 342.8004,
+      "eval_samples_per_second": 519.113,
+      "eval_steps_per_second": 32.445,
+      "step": 160580
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 1.2209738648603072e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f1368949b8a3ca0194b62ba5c01ad414ec8388ceb72de5c960a6415ef0bc7eb
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:acc77a725d52d6e34c7f61d7c679e4c1b46be2370324f266e5a1ff1d1bebc2bf
 size 118253458

runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90f59812f8ad810e2c50c9e69c1d3b4459e7d488705ec40983855bea3b4f8d6b
-size 49646

 version https://git-lfs.github.com/spec/v1
+oid sha256:be416dbc50f0cb836aa31ee963aba13302069cd1befb9ceaf72286a0cd5d4676
+size 57335