Training in progress, step 40000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +296 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f4a4b1c16a17272dd3d5d44145b877d0c14dc6e19c78bd41637a76bc87a0e7ea
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:33f0f667a5193eb4d35b243c5c1df790f53411abe8add627f8801dc7a6e453fb
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68ca690b9a0c619477d3038e9b1f2189091b893c636b800c671b19aeb6d28dba
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:338d656c8c08afe1535666116a30ec6c8bc16d2218bd3572b0ad6095b0a6fc86
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d04e325551f27b0abb1677ad51b5250cc6db4cb37a98cc2cc710661788306e4
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:f75ef4c1eb025b45e99753eb3086841a7a2849ad71d5bd6afa88ad76ffcffe8a
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eba75c9103403d8e6ccb33e21824c3bb41c5512582b8b3e0415b8a731bc74943
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:00b9e9e803d002d2b860a18a7caf54803f3c31024a6925df1ba4a7df5d623e98
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4bef14adf96a5be9d64a1df76f457ac5b2fcd08c7a9b48176945077bc67a3f2f
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:90b69642bdda2390c9b2aaa786137796ae481637fe31199c160a1cb107e6720e
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 36000,
   "best_metric": 0.9893807849919393,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-36000",
-  "epoch": 1.152,
   "eval_steps": 4000,
-  "global_step": 36000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2636,6 +2636,298 @@
       "eval_samples_per_second": 128.405,
       "eval_steps_per_second": 8.025,
       "step": 36000
     }
   ],
   "logging_steps": 100,
@@ -2650,7 +2942,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
@@ -2664,7 +2956,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.528656883652379e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 36000,
   "best_metric": 0.9893807849919393,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-36000",
+  "epoch": 1.28,
   "eval_steps": 4000,
+  "global_step": 40000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 128.405,
       "eval_steps_per_second": 8.025,
       "step": 36000
+    },
+    {
+      "epoch": 1.1552,
+      "grad_norm": 7.563354969024658,
+      "learning_rate": 1.542869983948636e-05,
+      "loss": 0.0446,
+      "step": 36100
+    },
+    {
+      "epoch": 1.1584,
+      "grad_norm": 0.017443129792809486,
+      "learning_rate": 1.541585874799358e-05,
+      "loss": 0.0472,
+      "step": 36200
+    },
+    {
+      "epoch": 1.1616,
+      "grad_norm": 0.007690173573791981,
+      "learning_rate": 1.5403017656500805e-05,
+      "loss": 0.0368,
+      "step": 36300
+    },
+    {
+      "epoch": 1.1648,
+      "grad_norm": 0.024819310754537582,
+      "learning_rate": 1.5390176565008027e-05,
+      "loss": 0.0466,
+      "step": 36400
+    },
+    {
+      "epoch": 1.168,
+      "grad_norm": 1.0305715799331665,
+      "learning_rate": 1.5377335473515248e-05,
+      "loss": 0.0396,
+      "step": 36500
+    },
+    {
+      "epoch": 1.1712,
+      "grad_norm": 13.792978286743164,
+      "learning_rate": 1.5364494382022473e-05,
+      "loss": 0.0382,
+      "step": 36600
+    },
+    {
+      "epoch": 1.1743999999999999,
+      "grad_norm": 4.012645721435547,
+      "learning_rate": 1.5351653290529694e-05,
+      "loss": 0.0519,
+      "step": 36700
+    },
+    {
+      "epoch": 1.1776,
+      "grad_norm": 0.015255521982908249,
+      "learning_rate": 1.533881219903692e-05,
+      "loss": 0.0331,
+      "step": 36800
+    },
+    {
+      "epoch": 1.1808,
+      "grad_norm": 0.03518729284405708,
+      "learning_rate": 1.532597110754414e-05,
+      "loss": 0.0442,
+      "step": 36900
+    },
+    {
+      "epoch": 1.184,
+      "grad_norm": 0.12012261152267456,
+      "learning_rate": 1.5313130016051365e-05,
+      "loss": 0.0392,
+      "step": 37000
+    },
+    {
+      "epoch": 1.1872,
+      "grad_norm": 0.03485884144902229,
+      "learning_rate": 1.5300288924558587e-05,
+      "loss": 0.0214,
+      "step": 37100
+    },
+    {
+      "epoch": 1.1904,
+      "grad_norm": 10.218805313110352,
+      "learning_rate": 1.528744783306581e-05,
+      "loss": 0.0528,
+      "step": 37200
+    },
+    {
+      "epoch": 1.1936,
+      "grad_norm": 0.0384359173476696,
+      "learning_rate": 1.5274606741573036e-05,
+      "loss": 0.0625,
+      "step": 37300
+    },
+    {
+      "epoch": 1.1968,
+      "grad_norm": 0.3779418170452118,
+      "learning_rate": 1.5261765650080258e-05,
+      "loss": 0.0328,
+      "step": 37400
+    },
+    {
+      "epoch": 1.2,
+      "grad_norm": 5.618625640869141,
+      "learning_rate": 1.5248924558587481e-05,
+      "loss": 0.065,
+      "step": 37500
+    },
+    {
+      "epoch": 1.2032,
+      "grad_norm": 2.0705819129943848,
+      "learning_rate": 1.5236083467094704e-05,
+      "loss": 0.0594,
+      "step": 37600
+    },
+    {
+      "epoch": 1.2064,
+      "grad_norm": 0.14193743467330933,
+      "learning_rate": 1.5223242375601927e-05,
+      "loss": 0.0417,
+      "step": 37700
+    },
+    {
+      "epoch": 1.2096,
+      "grad_norm": 0.034703925251960754,
+      "learning_rate": 1.521040128410915e-05,
+      "loss": 0.0389,
+      "step": 37800
+    },
+    {
+      "epoch": 1.2128,
+      "grad_norm": 0.011800256557762623,
+      "learning_rate": 1.5197560192616374e-05,
+      "loss": 0.0393,
+      "step": 37900
+    },
+    {
+      "epoch": 1.216,
+      "grad_norm": 0.28774189949035645,
+      "learning_rate": 1.5184719101123597e-05,
+      "loss": 0.0504,
+      "step": 38000
+    },
+    {
+      "epoch": 1.2192,
+      "grad_norm": 0.035763729363679886,
+      "learning_rate": 1.517187800963082e-05,
+      "loss": 0.0534,
+      "step": 38100
+    },
+    {
+      "epoch": 1.2224,
+      "grad_norm": 0.158742755651474,
+      "learning_rate": 1.5159036918138043e-05,
+      "loss": 0.0436,
+      "step": 38200
+    },
+    {
+      "epoch": 1.2256,
+      "grad_norm": 9.794978141784668,
+      "learning_rate": 1.5146195826645266e-05,
+      "loss": 0.0502,
+      "step": 38300
+    },
+    {
+      "epoch": 1.2288000000000001,
+      "grad_norm": 0.021368766203522682,
+      "learning_rate": 1.513335473515249e-05,
+      "loss": 0.0286,
+      "step": 38400
+    },
+    {
+      "epoch": 1.232,
+      "grad_norm": 0.5888408422470093,
+      "learning_rate": 1.5120513643659714e-05,
+      "loss": 0.0674,
+      "step": 38500
+    },
+    {
+      "epoch": 1.2352,
+      "grad_norm": 0.005416017957031727,
+      "learning_rate": 1.5107672552166937e-05,
+      "loss": 0.0381,
+      "step": 38600
+    },
+    {
+      "epoch": 1.2384,
+      "grad_norm": 0.03922798112034798,
+      "learning_rate": 1.5094831460674157e-05,
+      "loss": 0.0747,
+      "step": 38700
+    },
+    {
+      "epoch": 1.2416,
+      "grad_norm": 0.030901480466127396,
+      "learning_rate": 1.508199036918138e-05,
+      "loss": 0.0491,
+      "step": 38800
+    },
+    {
+      "epoch": 1.2448,
+      "grad_norm": 0.02417912147939205,
+      "learning_rate": 1.5069149277688603e-05,
+      "loss": 0.0465,
+      "step": 38900
+    },
+    {
+      "epoch": 1.248,
+      "grad_norm": 15.668951988220215,
+      "learning_rate": 1.5056308186195826e-05,
+      "loss": 0.0535,
+      "step": 39000
+    },
+    {
+      "epoch": 1.2511999999999999,
+      "grad_norm": 0.21102702617645264,
+      "learning_rate": 1.504346709470305e-05,
+      "loss": 0.0517,
+      "step": 39100
+    },
+    {
+      "epoch": 1.2544,
+      "grad_norm": 0.06641241163015366,
+      "learning_rate": 1.5030626003210274e-05,
+      "loss": 0.0416,
+      "step": 39200
+    },
+    {
+      "epoch": 1.2576,
+      "grad_norm": 0.5495890974998474,
+      "learning_rate": 1.5017784911717497e-05,
+      "loss": 0.0357,
+      "step": 39300
+    },
+    {
+      "epoch": 1.2608,
+      "grad_norm": 0.035381533205509186,
+      "learning_rate": 1.500494382022472e-05,
+      "loss": 0.0577,
+      "step": 39400
+    },
+    {
+      "epoch": 1.264,
+      "grad_norm": 0.03879441320896149,
+      "learning_rate": 1.4992102728731944e-05,
+      "loss": 0.0191,
+      "step": 39500
+    },
+    {
+      "epoch": 1.2671999999999999,
+      "grad_norm": 0.014720222912728786,
+      "learning_rate": 1.4979261637239167e-05,
+      "loss": 0.0423,
+      "step": 39600
+    },
+    {
+      "epoch": 1.2704,
+      "grad_norm": 3.2292592525482178,
+      "learning_rate": 1.496642054574639e-05,
+      "loss": 0.0602,
+      "step": 39700
+    },
+    {
+      "epoch": 1.2736,
+      "grad_norm": 1.6030577421188354,
+      "learning_rate": 1.4953579454253613e-05,
+      "loss": 0.0543,
+      "step": 39800
+    },
+    {
+      "epoch": 1.2768,
+      "grad_norm": 0.031688716262578964,
+      "learning_rate": 1.4940738362760836e-05,
+      "loss": 0.0341,
+      "step": 39900
+    },
+    {
+      "epoch": 1.28,
+      "grad_norm": 9.190576553344727,
+      "learning_rate": 1.492789727126806e-05,
+      "loss": 0.0381,
+      "step": 40000
+    },
+    {
+      "epoch": 1.28,
+      "eval_accuracy": 0.98796,
+      "eval_f1": 0.9879625821520611,
+      "eval_loss": 0.04839452728629112,
+      "eval_precision": 0.9880194851769686,
+      "eval_recall": 0.98796,
+      "eval_runtime": 777.527,
+      "eval_samples_per_second": 128.613,
+      "eval_steps_per_second": 8.038,
+      "step": 40000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.698520718775022e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null