Training in progress, step 32000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +298 -6

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:975b3db65f8ee4e6188b6e86efc13e7b0764db49eec13babdd30b47f2f1608b9
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f5cafd52307ebb0d4ad02660f4fa895f4176ab48ccb18d8698902129b3b1209
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b11ba4eb38c9365e25a19aa1849379c94eb8123f5f95fdedf2db233422df02e9
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:26d3696bade1cccaee17e0a3be137fdd3e3380bab51d20a657d51f20328ef6ef
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c9c0d47048189414b4e2674d62285eb69167766265a633b317b379e2de5cad7
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:819540c05377c6a98947b46ab098a8f4456dd635badbf1ea38d292430af1a819
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a918540d48e856372c74bc697e7d28a86a7fdf24471d9a4adf2ffeeae4217207
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d960d60d0c4ed45cc4422d14d1920d93529483656b6082492613ed8fd865f5f
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e4ab9378d6970094f99c33aa1f077f43da045d25f84f4484908cc97d7399e61f
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:25361f5602fa6c5f9d3627497e44e73d38bd7e5fabd543717ca1fb3c15c5a95b
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 28000,
-  "best_metric": 0.9878109998616666,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-28000",
-  "epoch": 0.896,
   "eval_steps": 4000,
-  "global_step": 28000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2052,6 +2052,298 @@
       "eval_samples_per_second": 128.429,
       "eval_steps_per_second": 8.027,
       "step": 28000
     }
   ],
   "logging_steps": 100,
@@ -2080,7 +2372,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.1889930140587046e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 32000,
+  "best_metric": 0.9879419419991998,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-32000",
+  "epoch": 1.024,
   "eval_steps": 4000,
+  "global_step": 32000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 128.429,
       "eval_steps_per_second": 8.027,
       "step": 28000
+    },
+    {
+      "epoch": 0.8992,
+      "grad_norm": 0.008244618773460388,
+      "learning_rate": 1.6455987158908508e-05,
+      "loss": 0.041,
+      "step": 28100
+    },
+    {
+      "epoch": 0.9024,
+      "grad_norm": 0.01580977439880371,
+      "learning_rate": 1.6443146067415733e-05,
+      "loss": 0.057,
+      "step": 28200
+    },
+    {
+      "epoch": 0.9056,
+      "grad_norm": 10.525986671447754,
+      "learning_rate": 1.6430304975922954e-05,
+      "loss": 0.0322,
+      "step": 28300
+    },
+    {
+      "epoch": 0.9088,
+      "grad_norm": 0.016806138679385185,
+      "learning_rate": 1.641746388443018e-05,
+      "loss": 0.0523,
+      "step": 28400
+    },
+    {
+      "epoch": 0.912,
+      "grad_norm": 6.311640739440918,
+      "learning_rate": 1.64046227929374e-05,
+      "loss": 0.0497,
+      "step": 28500
+    },
+    {
+      "epoch": 0.9152,
+      "grad_norm": 0.09537007659673691,
+      "learning_rate": 1.6391781701444625e-05,
+      "loss": 0.0523,
+      "step": 28600
+    },
+    {
+      "epoch": 0.9184,
+      "grad_norm": 0.010998793877661228,
+      "learning_rate": 1.6378940609951847e-05,
+      "loss": 0.0481,
+      "step": 28700
+    },
+    {
+      "epoch": 0.9216,
+      "grad_norm": 0.24172453582286835,
+      "learning_rate": 1.636609951845907e-05,
+      "loss": 0.0537,
+      "step": 28800
+    },
+    {
+      "epoch": 0.9248,
+      "grad_norm": 0.00843421183526516,
+      "learning_rate": 1.6353258426966293e-05,
+      "loss": 0.0345,
+      "step": 28900
+    },
+    {
+      "epoch": 0.928,
+      "grad_norm": 26.664979934692383,
+      "learning_rate": 1.6340417335473518e-05,
+      "loss": 0.0667,
+      "step": 29000
+    },
+    {
+      "epoch": 0.9312,
+      "grad_norm": 0.3694003224372864,
+      "learning_rate": 1.632757624398074e-05,
+      "loss": 0.0555,
+      "step": 29100
+    },
+    {
+      "epoch": 0.9344,
+      "grad_norm": 24.855958938598633,
+      "learning_rate": 1.6314735152487964e-05,
+      "loss": 0.058,
+      "step": 29200
+    },
+    {
+      "epoch": 0.9376,
+      "grad_norm": 2.051378011703491,
+      "learning_rate": 1.6301894060995186e-05,
+      "loss": 0.0427,
+      "step": 29300
+    },
+    {
+      "epoch": 0.9408,
+      "grad_norm": 0.8996158838272095,
+      "learning_rate": 1.6289052969502407e-05,
+      "loss": 0.0462,
+      "step": 29400
+    },
+    {
+      "epoch": 0.944,
+      "grad_norm": 14.316937446594238,
+      "learning_rate": 1.6276211878009632e-05,
+      "loss": 0.0658,
+      "step": 29500
+    },
+    {
+      "epoch": 0.9472,
+      "grad_norm": 11.959718704223633,
+      "learning_rate": 1.6263370786516853e-05,
+      "loss": 0.0396,
+      "step": 29600
+    },
+    {
+      "epoch": 0.9504,
+      "grad_norm": 0.015293744392693043,
+      "learning_rate": 1.6250529695024078e-05,
+      "loss": 0.0489,
+      "step": 29700
+    },
+    {
+      "epoch": 0.9536,
+      "grad_norm": 14.037763595581055,
+      "learning_rate": 1.62376886035313e-05,
+      "loss": 0.0746,
+      "step": 29800
+    },
+    {
+      "epoch": 0.9568,
+      "grad_norm": 0.04080112278461456,
+      "learning_rate": 1.6224847512038524e-05,
+      "loss": 0.0612,
+      "step": 29900
+    },
+    {
+      "epoch": 0.96,
+      "grad_norm": 0.06590835005044937,
+      "learning_rate": 1.6212006420545746e-05,
+      "loss": 0.0597,
+      "step": 30000
+    },
+    {
+      "epoch": 0.9632,
+      "grad_norm": 8.91706657409668,
+      "learning_rate": 1.619916532905297e-05,
+      "loss": 0.0489,
+      "step": 30100
+    },
+    {
+      "epoch": 0.9664,
+      "grad_norm": 0.019029080867767334,
+      "learning_rate": 1.6186324237560192e-05,
+      "loss": 0.0572,
+      "step": 30200
+    },
+    {
+      "epoch": 0.9696,
+      "grad_norm": 4.674193382263184,
+      "learning_rate": 1.6173483146067417e-05,
+      "loss": 0.0587,
+      "step": 30300
+    },
+    {
+      "epoch": 0.9728,
+      "grad_norm": 0.14981134235858917,
+      "learning_rate": 1.6160642054574642e-05,
+      "loss": 0.0323,
+      "step": 30400
+    },
+    {
+      "epoch": 0.976,
+      "grad_norm": 4.462047100067139,
+      "learning_rate": 1.6147800963081863e-05,
+      "loss": 0.053,
+      "step": 30500
+    },
+    {
+      "epoch": 0.9792,
+      "grad_norm": 0.10449015349149704,
+      "learning_rate": 1.6134959871589088e-05,
+      "loss": 0.0465,
+      "step": 30600
+    },
+    {
+      "epoch": 0.9824,
+      "grad_norm": 1.134883999824524,
+      "learning_rate": 1.612211878009631e-05,
+      "loss": 0.0534,
+      "step": 30700
+    },
+    {
+      "epoch": 0.9856,
+      "grad_norm": 21.06899070739746,
+      "learning_rate": 1.6109277688603534e-05,
+      "loss": 0.0515,
+      "step": 30800
+    },
+    {
+      "epoch": 0.9888,
+      "grad_norm": 20.929187774658203,
+      "learning_rate": 1.6096436597110756e-05,
+      "loss": 0.046,
+      "step": 30900
+    },
+    {
+      "epoch": 0.992,
+      "grad_norm": 0.008979029022157192,
+      "learning_rate": 1.608359550561798e-05,
+      "loss": 0.0288,
+      "step": 31000
+    },
+    {
+      "epoch": 0.9952,
+      "grad_norm": 10.832496643066406,
+      "learning_rate": 1.6070754414125202e-05,
+      "loss": 0.0533,
+      "step": 31100
+    },
+    {
+      "epoch": 0.9984,
+      "grad_norm": 10.279513359069824,
+      "learning_rate": 1.6057913322632427e-05,
+      "loss": 0.0535,
+      "step": 31200
+    },
+    {
+      "epoch": 1.0016,
+      "grad_norm": 0.050070084631443024,
+      "learning_rate": 1.6045072231139648e-05,
+      "loss": 0.0488,
+      "step": 31300
+    },
+    {
+      "epoch": 1.0048,
+      "grad_norm": 7.610085964202881,
+      "learning_rate": 1.6032231139646873e-05,
+      "loss": 0.0499,
+      "step": 31400
+    },
+    {
+      "epoch": 1.008,
+      "grad_norm": 0.03847907483577728,
+      "learning_rate": 1.6019390048154095e-05,
+      "loss": 0.0668,
+      "step": 31500
+    },
+    {
+      "epoch": 1.0112,
+      "grad_norm": 0.009822272695600986,
+      "learning_rate": 1.600654895666132e-05,
+      "loss": 0.0403,
+      "step": 31600
+    },
+    {
+      "epoch": 1.0144,
+      "grad_norm": 0.1967863291501999,
+      "learning_rate": 1.599370786516854e-05,
+      "loss": 0.0565,
+      "step": 31700
+    },
+    {
+      "epoch": 1.0176,
+      "grad_norm": 8.522165298461914,
+      "learning_rate": 1.5980866773675762e-05,
+      "loss": 0.0298,
+      "step": 31800
+    },
+    {
+      "epoch": 1.0208,
+      "grad_norm": 0.7742573618888855,
+      "learning_rate": 1.5968025682182987e-05,
+      "loss": 0.0411,
+      "step": 31900
+    },
+    {
+      "epoch": 1.024,
+      "grad_norm": 0.07143627107143402,
+      "learning_rate": 1.595518459069021e-05,
+      "loss": 0.0477,
+      "step": 32000
+    },
+    {
+      "epoch": 1.024,
+      "eval_accuracy": 0.98794,
+      "eval_f1": 0.9879419419991998,
+      "eval_loss": 0.04801899939775467,
+      "eval_precision": 0.9879724568651884,
+      "eval_recall": 0.98794,
+      "eval_runtime": 775.4534,
+      "eval_samples_per_second": 128.957,
+      "eval_steps_per_second": 8.06,
+      "step": 32000
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 1.3588330900845235e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null