Training in progress, step 28000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +299 -7

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:63d8709297afd894af99a163299f58c25d0ecf4c1109fb33c6ca599b695c1163
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:975b3db65f8ee4e6188b6e86efc13e7b0764db49eec13babdd30b47f2f1608b9
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c62a5ee613bedcbe24f1782d277ddaa2c1353f7999a9b5d9c7e67060088462a
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:b11ba4eb38c9365e25a19aa1849379c94eb8123f5f95fdedf2db233422df02e9
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:732f3f8948a77bf9ef00b9a71ed21980be5bb4dfbe32b4f3c8a750669102d82c
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c9c0d47048189414b4e2674d62285eb69167766265a633b317b379e2de5cad7
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:809d9e108b4a097a87eb7ca47b7d07656e83c40d06f4eb5e0ec99a3edb4019d0
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:a918540d48e856372c74bc697e7d28a86a7fdf24471d9a4adf2ffeeae4217207
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:23fadf64bbbf065d62df9416650b6887ec1c2b6763b291ed80fa5ee507341cf0
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:e4ab9378d6970094f99c33aa1f077f43da045d25f84f4484908cc97d7399e61f
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 20000,
-  "best_metric": 0.9846426496660109,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-20000",
-  "epoch": 0.768,
   "eval_steps": 4000,
-  "global_step": 24000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1760,6 +1760,298 @@
       "eval_samples_per_second": 129.122,
       "eval_steps_per_second": 8.07,
       "step": 24000
     }
   ],
   "logging_steps": 100,
@@ -1774,7 +2066,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
@@ -1788,7 +2080,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.0191521072952346e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 28000,
+  "best_metric": 0.9878109998616666,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-28000",
+  "epoch": 0.896,
   "eval_steps": 4000,
+  "global_step": 28000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 129.122,
       "eval_steps_per_second": 8.07,
       "step": 24000
+    },
+    {
+      "epoch": 0.7712,
+      "grad_norm": 0.025170153006911278,
+      "learning_rate": 1.6969630818619586e-05,
+      "loss": 0.0476,
+      "step": 24100
+    },
+    {
+      "epoch": 0.7744,
+      "grad_norm": 0.005416714586317539,
+      "learning_rate": 1.6956789727126807e-05,
+      "loss": 0.0625,
+      "step": 24200
+    },
+    {
+      "epoch": 0.7776,
+      "grad_norm": 35.962677001953125,
+      "learning_rate": 1.6943948635634032e-05,
+      "loss": 0.0492,
+      "step": 24300
+    },
+    {
+      "epoch": 0.7808,
+      "grad_norm": 0.019019972532987595,
+      "learning_rate": 1.6931107544141254e-05,
+      "loss": 0.0567,
+      "step": 24400
+    },
+    {
+      "epoch": 0.784,
+      "grad_norm": 4.536252021789551,
+      "learning_rate": 1.691826645264848e-05,
+      "loss": 0.0564,
+      "step": 24500
+    },
+    {
+      "epoch": 0.7872,
+      "grad_norm": 20.884357452392578,
+      "learning_rate": 1.69054253611557e-05,
+      "loss": 0.059,
+      "step": 24600
+    },
+    {
+      "epoch": 0.7904,
+      "grad_norm": 4.154411792755127,
+      "learning_rate": 1.689258426966292e-05,
+      "loss": 0.0567,
+      "step": 24700
+    },
+    {
+      "epoch": 0.7936,
+      "grad_norm": 0.23815973103046417,
+      "learning_rate": 1.6879743178170146e-05,
+      "loss": 0.0593,
+      "step": 24800
+    },
+    {
+      "epoch": 0.7968,
+      "grad_norm": 0.027695050463080406,
+      "learning_rate": 1.6866902086677368e-05,
+      "loss": 0.0545,
+      "step": 24900
+    },
+    {
+      "epoch": 0.8,
+      "grad_norm": 0.052229318767786026,
+      "learning_rate": 1.6854060995184592e-05,
+      "loss": 0.0584,
+      "step": 25000
+    },
+    {
+      "epoch": 0.8032,
+      "grad_norm": 0.007615574169903994,
+      "learning_rate": 1.6841219903691814e-05,
+      "loss": 0.0492,
+      "step": 25100
+    },
+    {
+      "epoch": 0.8064,
+      "grad_norm": 0.34495148062705994,
+      "learning_rate": 1.682837881219904e-05,
+      "loss": 0.0512,
+      "step": 25200
+    },
+    {
+      "epoch": 0.8096,
+      "grad_norm": 0.4945124685764313,
+      "learning_rate": 1.681553772070626e-05,
+      "loss": 0.0659,
+      "step": 25300
+    },
+    {
+      "epoch": 0.8128,
+      "grad_norm": 3.508509397506714,
+      "learning_rate": 1.6802696629213485e-05,
+      "loss": 0.0431,
+      "step": 25400
+    },
+    {
+      "epoch": 0.816,
+      "grad_norm": 9.751060485839844,
+      "learning_rate": 1.6789855537720706e-05,
+      "loss": 0.0609,
+      "step": 25500
+    },
+    {
+      "epoch": 0.8192,
+      "grad_norm": 13.404821395874023,
+      "learning_rate": 1.677701444622793e-05,
+      "loss": 0.0451,
+      "step": 25600
+    },
+    {
+      "epoch": 0.8224,
+      "grad_norm": 0.09565193206071854,
+      "learning_rate": 1.6764173354735153e-05,
+      "loss": 0.0545,
+      "step": 25700
+    },
+    {
+      "epoch": 0.8256,
+      "grad_norm": 0.010966203175485134,
+      "learning_rate": 1.6751332263242377e-05,
+      "loss": 0.0703,
+      "step": 25800
+    },
+    {
+      "epoch": 0.8288,
+      "grad_norm": 0.18196341395378113,
+      "learning_rate": 1.67384911717496e-05,
+      "loss": 0.0392,
+      "step": 25900
+    },
+    {
+      "epoch": 0.832,
+      "grad_norm": 15.195699691772461,
+      "learning_rate": 1.6725650080256824e-05,
+      "loss": 0.0429,
+      "step": 26000
+    },
+    {
+      "epoch": 0.8352,
+      "grad_norm": 0.2465728521347046,
+      "learning_rate": 1.6712808988764045e-05,
+      "loss": 0.0546,
+      "step": 26100
+    },
+    {
+      "epoch": 0.8384,
+      "grad_norm": 15.004085540771484,
+      "learning_rate": 1.669996789727127e-05,
+      "loss": 0.0716,
+      "step": 26200
+    },
+    {
+      "epoch": 0.8416,
+      "grad_norm": 0.17839568853378296,
+      "learning_rate": 1.668712680577849e-05,
+      "loss": 0.0413,
+      "step": 26300
+    },
+    {
+      "epoch": 0.8448,
+      "grad_norm": 30.638254165649414,
+      "learning_rate": 1.6674285714285716e-05,
+      "loss": 0.0391,
+      "step": 26400
+    },
+    {
+      "epoch": 0.848,
+      "grad_norm": 8.340238571166992,
+      "learning_rate": 1.6661444622792938e-05,
+      "loss": 0.0579,
+      "step": 26500
+    },
+    {
+      "epoch": 0.8512,
+      "grad_norm": 0.026733344420790672,
+      "learning_rate": 1.6648603531300163e-05,
+      "loss": 0.0647,
+      "step": 26600
+    },
+    {
+      "epoch": 0.8544,
+      "grad_norm": 0.013905318453907967,
+      "learning_rate": 1.6635762439807387e-05,
+      "loss": 0.0258,
+      "step": 26700
+    },
+    {
+      "epoch": 0.8576,
+      "grad_norm": 0.011157176457345486,
+      "learning_rate": 1.662292134831461e-05,
+      "loss": 0.0497,
+      "step": 26800
+    },
+    {
+      "epoch": 0.8608,
+      "grad_norm": 0.029731517657637596,
+      "learning_rate": 1.6610080256821834e-05,
+      "loss": 0.0567,
+      "step": 26900
+    },
+    {
+      "epoch": 0.864,
+      "grad_norm": 0.3443889319896698,
+      "learning_rate": 1.6597239165329055e-05,
+      "loss": 0.0533,
+      "step": 27000
+    },
+    {
+      "epoch": 0.8672,
+      "grad_norm": 0.5098379254341125,
+      "learning_rate": 1.6584398073836277e-05,
+      "loss": 0.0532,
+      "step": 27100
+    },
+    {
+      "epoch": 0.8704,
+      "grad_norm": 0.045412395149469376,
+      "learning_rate": 1.6571556982343498e-05,
+      "loss": 0.0533,
+      "step": 27200
+    },
+    {
+      "epoch": 0.8736,
+      "grad_norm": 3.6077659130096436,
+      "learning_rate": 1.6558715890850723e-05,
+      "loss": 0.0432,
+      "step": 27300
+    },
+    {
+      "epoch": 0.8768,
+      "grad_norm": 27.717470169067383,
+      "learning_rate": 1.6545874799357948e-05,
+      "loss": 0.0599,
+      "step": 27400
+    },
+    {
+      "epoch": 0.88,
+      "grad_norm": 8.342029571533203,
+      "learning_rate": 1.653303370786517e-05,
+      "loss": 0.066,
+      "step": 27500
+    },
+    {
+      "epoch": 0.8832,
+      "grad_norm": 0.09634260088205338,
+      "learning_rate": 1.6520192616372394e-05,
+      "loss": 0.0516,
+      "step": 27600
+    },
+    {
+      "epoch": 0.8864,
+      "grad_norm": 0.13491930067539215,
+      "learning_rate": 1.6507351524879615e-05,
+      "loss": 0.0539,
+      "step": 27700
+    },
+    {
+      "epoch": 0.8896,
+      "grad_norm": 0.23464186489582062,
+      "learning_rate": 1.649451043338684e-05,
+      "loss": 0.0415,
+      "step": 27800
+    },
+    {
+      "epoch": 0.8928,
+      "grad_norm": 0.46864306926727295,
+      "learning_rate": 1.648166934189406e-05,
+      "loss": 0.0535,
+      "step": 27900
+    },
+    {
+      "epoch": 0.896,
+      "grad_norm": 6.844827175140381,
+      "learning_rate": 1.6468828250401286e-05,
+      "loss": 0.064,
+      "step": 28000
+    },
+    {
+      "epoch": 0.896,
+      "eval_accuracy": 0.98781,
+      "eval_f1": 0.9878109998616666,
+      "eval_loss": 0.04953546077013016,
+      "eval_precision": 0.9878187731391986,
+      "eval_recall": 0.98781,
+      "eval_runtime": 778.6432,
+      "eval_samples_per_second": 128.429,
+      "eval_steps_per_second": 8.027,
+      "step": 28000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.1889930140587046e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null