update

Browse files

Files changed (5) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
rng_state.pth +1 -1
scheduler.pt +1 -1
trainer_state.json +123 -3

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9db7b16c71061c51c95abdd9a98926418625727c317ce63822699d83286752f0
 size 871313389

 version https://git-lfs.github.com/spec/v1
+oid sha256:579babb9ce23573912a301bc1751de67cf9825ec3ea9317a2e01ffe73fe79455
 size 871313389

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:77a3836119cefac1ae6ae48708f4c04ffeb0e154f5e7affc3391210581fb2472
 size 435682807

 version https://git-lfs.github.com/spec/v1
+oid sha256:066ce09e712752766615c1b53e42e41f5d069d3b600761e41b63ce9cebbdf3f0
 size 435682807

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:20f8ab5fc2c073e108f2126ff07a14c70c8351f6b3e50e7f66ea48efcf4b2af2
 size 14657

 version https://git-lfs.github.com/spec/v1
+oid sha256:22ef52bddeff60306a441bc1a3df088a0a8624db9d38fee3f8b4d84b0ab49949
 size 14657

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8280222b67d76838a5f5a8e175e89c9fa85060a19ae5e227aea995ff67e7b224
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:042af15c79784565ba53d294ccda64499ce1432cf6644e625e4cc137910bd1d8
 size 623

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 3.61271676300578,
-  "global_step": 10000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -126,11 +126,131 @@
       "learning_rate": 3.19364161849711e-05,
       "loss": 0.0033,
       "step": 10000
     }
   ],
   "max_steps": 27680,
   "num_train_epochs": 10,
-  "total_flos": 1550396267341344.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 7.22543352601156,
+  "global_step": 20000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 3.19364161849711e-05,
       "loss": 0.0033,
       "step": 10000
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 3.103323699421966e-05,
+      "loss": 0.0009,
+      "step": 10500
+    },
+    {
+      "epoch": 3.97,
+      "learning_rate": 3.013005780346821e-05,
+      "loss": 0.0012,
+      "step": 11000
+    },
+    {
+      "epoch": 4.15,
+      "learning_rate": 2.9226878612716762e-05,
+      "loss": 0.0007,
+      "step": 11500
+    },
+    {
+      "epoch": 4.34,
+      "learning_rate": 2.832369942196532e-05,
+      "loss": 0.0019,
+      "step": 12000
+    },
+    {
+      "epoch": 4.52,
+      "learning_rate": 2.7420520231213876e-05,
+      "loss": 0.0009,
+      "step": 12500
+    },
+    {
+      "epoch": 4.7,
+      "learning_rate": 2.651734104046243e-05,
+      "loss": 0.0006,
+      "step": 13000
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 2.5614161849710984e-05,
+      "loss": 0.0005,
+      "step": 13500
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 2.471098265895954e-05,
+      "loss": 0.0021,
+      "step": 14000
+    },
+    {
+      "epoch": 5.24,
+      "learning_rate": 2.380780346820809e-05,
+      "loss": 0.0023,
+      "step": 14500
+    },
+    {
+      "epoch": 5.42,
+      "learning_rate": 2.290462427745665e-05,
+      "loss": 0.0004,
+      "step": 15000
+    },
+    {
+      "epoch": 5.6,
+      "learning_rate": 2.2001445086705202e-05,
+      "loss": 0.0008,
+      "step": 15500
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 2.1098265895953757e-05,
+      "loss": 0.0001,
+      "step": 16000
+    },
+    {
+      "epoch": 5.96,
+      "learning_rate": 2.0195086705202312e-05,
+      "loss": 0.0011,
+      "step": 16500
+    },
+    {
+      "epoch": 6.14,
+      "learning_rate": 1.9291907514450868e-05,
+      "loss": 0.0015,
+      "step": 17000
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 1.8388728323699423e-05,
+      "loss": 0.0004,
+      "step": 17500
+    },
+    {
+      "epoch": 6.5,
+      "learning_rate": 1.748554913294798e-05,
+      "loss": 0.0003,
+      "step": 18000
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 1.6582369942196534e-05,
+      "loss": 0.0,
+      "step": 18500
+    },
+    {
+      "epoch": 6.86,
+      "learning_rate": 1.567919075144509e-05,
+      "loss": 0.0002,
+      "step": 19000
+    },
+    {
+      "epoch": 7.04,
+      "learning_rate": 1.4776011560693643e-05,
+      "loss": 0.0005,
+      "step": 19500
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1.3872832369942197e-05,
+      "loss": 0.0001,
+      "step": 20000
     }
   ],
   "max_steps": 27680,
   "num_train_epochs": 10,
+  "total_flos": 3107617302960360.0,
   "trial_name": null,
   "trial_params": null
 }