Training in progress, step 16000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +298 -6

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22bd38c8f37046bd62018eb7378b2b711b978047511760c0db69629ca9b301ad
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:dd57384594eb425dd0bbabba65317a1b5777b6c5b289479078bfbc0a2b10c7cd
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:118eb527e3f3d95f6bbf2dc9c4c0579763f722fb5753842653cc84555c706dc2
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a90fca018f105f0c4de5bd49a9f37f48eb4343bbd82fa5c86a766904ed07780
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ae035518883f7d805914f164f0380793c8a3934e907b1f7143d4918513187a8
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:60e040819bef00bdfb5631475cda110717053ec4d4c4c67d6781ad7edccde1fd
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a1d6e49e1244c2136fab7f3074345ca5593ed632d4d0d6d129c6fe8e480d66c
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:9569b0daf1a454e36aca0fe6fc85ec984df4b90957450731328ceedec7505da8
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:645e796050c981f4589900a1facddd99613e38baf853710ef8a2a7fa1c39977d
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:8187ef3352672be0a48a06b17757282db7b3ef79dad63ef57d1187dc8f56fd82
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 12000,
-  "best_metric": 0.97856556986665,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-12000",
-  "epoch": 0.384,
   "eval_steps": 4000,
-  "global_step": 12000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -884,6 +884,298 @@
       "eval_samples_per_second": 121.628,
       "eval_steps_per_second": 7.602,
       "step": 12000
     }
   ],
   "logging_steps": 100,
@@ -912,7 +1204,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 5.096626165108723e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 16000,
+  "best_metric": 0.9820134202589396,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-16000",
+  "epoch": 0.512,
   "eval_steps": 4000,
+  "global_step": 16000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 121.628,
       "eval_steps_per_second": 7.602,
       "step": 12000
+    },
+    {
+      "epoch": 0.3872,
+      "grad_norm": 11.900330543518066,
+      "learning_rate": 1.851056179775281e-05,
+      "loss": 0.0958,
+      "step": 12100
+    },
+    {
+      "epoch": 0.3904,
+      "grad_norm": 18.242124557495117,
+      "learning_rate": 1.8497720706260034e-05,
+      "loss": 0.075,
+      "step": 12200
+    },
+    {
+      "epoch": 0.3936,
+      "grad_norm": 0.0790882408618927,
+      "learning_rate": 1.8484879614767256e-05,
+      "loss": 0.071,
+      "step": 12300
+    },
+    {
+      "epoch": 0.3968,
+      "grad_norm": 16.233280181884766,
+      "learning_rate": 1.847203852327448e-05,
+      "loss": 0.1109,
+      "step": 12400
+    },
+    {
+      "epoch": 0.4,
+      "grad_norm": 12.048758506774902,
+      "learning_rate": 1.8459197431781702e-05,
+      "loss": 0.0703,
+      "step": 12500
+    },
+    {
+      "epoch": 0.4032,
+      "grad_norm": 9.086562156677246,
+      "learning_rate": 1.8446356340288927e-05,
+      "loss": 0.0706,
+      "step": 12600
+    },
+    {
+      "epoch": 0.4064,
+      "grad_norm": 9.871477127075195,
+      "learning_rate": 1.843351524879615e-05,
+      "loss": 0.0745,
+      "step": 12700
+    },
+    {
+      "epoch": 0.4096,
+      "grad_norm": 0.7136130928993225,
+      "learning_rate": 1.8420674157303373e-05,
+      "loss": 0.0544,
+      "step": 12800
+    },
+    {
+      "epoch": 0.4128,
+      "grad_norm": 10.892882347106934,
+      "learning_rate": 1.8407833065810598e-05,
+      "loss": 0.1109,
+      "step": 12900
+    },
+    {
+      "epoch": 0.416,
+      "grad_norm": 1.3350844383239746,
+      "learning_rate": 1.839499197431782e-05,
+      "loss": 0.0898,
+      "step": 13000
+    },
+    {
+      "epoch": 0.4192,
+      "grad_norm": 11.215353012084961,
+      "learning_rate": 1.838215088282504e-05,
+      "loss": 0.0963,
+      "step": 13100
+    },
+    {
+      "epoch": 0.4224,
+      "grad_norm": 0.2309681475162506,
+      "learning_rate": 1.8369309791332262e-05,
+      "loss": 0.0785,
+      "step": 13200
+    },
+    {
+      "epoch": 0.4256,
+      "grad_norm": 0.0822586640715599,
+      "learning_rate": 1.8356468699839487e-05,
+      "loss": 0.0736,
+      "step": 13300
+    },
+    {
+      "epoch": 0.4288,
+      "grad_norm": 0.6296452283859253,
+      "learning_rate": 1.834362760834671e-05,
+      "loss": 0.1064,
+      "step": 13400
+    },
+    {
+      "epoch": 0.432,
+      "grad_norm": 7.989764213562012,
+      "learning_rate": 1.8330786516853933e-05,
+      "loss": 0.0885,
+      "step": 13500
+    },
+    {
+      "epoch": 0.4352,
+      "grad_norm": 0.04016461223363876,
+      "learning_rate": 1.8317945425361158e-05,
+      "loss": 0.0574,
+      "step": 13600
+    },
+    {
+      "epoch": 0.4384,
+      "grad_norm": 0.03219222649931908,
+      "learning_rate": 1.830510433386838e-05,
+      "loss": 0.0742,
+      "step": 13700
+    },
+    {
+      "epoch": 0.4416,
+      "grad_norm": 11.071674346923828,
+      "learning_rate": 1.8292263242375605e-05,
+      "loss": 0.0968,
+      "step": 13800
+    },
+    {
+      "epoch": 0.4448,
+      "grad_norm": 22.920804977416992,
+      "learning_rate": 1.8279422150882826e-05,
+      "loss": 0.0782,
+      "step": 13900
+    },
+    {
+      "epoch": 0.448,
+      "grad_norm": 0.05693759024143219,
+      "learning_rate": 1.826658105939005e-05,
+      "loss": 0.0538,
+      "step": 14000
+    },
+    {
+      "epoch": 0.4512,
+      "grad_norm": 0.08659256994724274,
+      "learning_rate": 1.8253739967897272e-05,
+      "loss": 0.0699,
+      "step": 14100
+    },
+    {
+      "epoch": 0.4544,
+      "grad_norm": 3.1322948932647705,
+      "learning_rate": 1.8240898876404497e-05,
+      "loss": 0.0841,
+      "step": 14200
+    },
+    {
+      "epoch": 0.4576,
+      "grad_norm": 0.025594089180231094,
+      "learning_rate": 1.822805778491172e-05,
+      "loss": 0.1108,
+      "step": 14300
+    },
+    {
+      "epoch": 0.4608,
+      "grad_norm": 0.5694848299026489,
+      "learning_rate": 1.8215216693418943e-05,
+      "loss": 0.0705,
+      "step": 14400
+    },
+    {
+      "epoch": 0.464,
+      "grad_norm": 5.643801212310791,
+      "learning_rate": 1.8202375601926165e-05,
+      "loss": 0.0773,
+      "step": 14500
+    },
+    {
+      "epoch": 0.4672,
+      "grad_norm": 1.6325165033340454,
+      "learning_rate": 1.818953451043339e-05,
+      "loss": 0.1244,
+      "step": 14600
+    },
+    {
+      "epoch": 0.4704,
+      "grad_norm": 0.04731294512748718,
+      "learning_rate": 1.817669341894061e-05,
+      "loss": 0.0523,
+      "step": 14700
+    },
+    {
+      "epoch": 0.4736,
+      "grad_norm": 9.385772705078125,
+      "learning_rate": 1.8163852327447836e-05,
+      "loss": 0.0739,
+      "step": 14800
+    },
+    {
+      "epoch": 0.4768,
+      "grad_norm": 0.04752274602651596,
+      "learning_rate": 1.8151011235955057e-05,
+      "loss": 0.0636,
+      "step": 14900
+    },
+    {
+      "epoch": 0.48,
+      "grad_norm": 0.4523526430130005,
+      "learning_rate": 1.8138170144462282e-05,
+      "loss": 0.0907,
+      "step": 15000
+    },
+    {
+      "epoch": 0.4832,
+      "grad_norm": 0.10660147666931152,
+      "learning_rate": 1.8125329052969504e-05,
+      "loss": 0.1093,
+      "step": 15100
+    },
+    {
+      "epoch": 0.4864,
+      "grad_norm": 0.024508710950613022,
+      "learning_rate": 1.811248796147673e-05,
+      "loss": 0.0562,
+      "step": 15200
+    },
+    {
+      "epoch": 0.4896,
+      "grad_norm": 4.832937240600586,
+      "learning_rate": 1.809964686998395e-05,
+      "loss": 0.0694,
+      "step": 15300
+    },
+    {
+      "epoch": 0.4928,
+      "grad_norm": 12.76455020904541,
+      "learning_rate": 1.808680577849117e-05,
+      "loss": 0.0525,
+      "step": 15400
+    },
+    {
+      "epoch": 0.496,
+      "grad_norm": 0.244754359126091,
+      "learning_rate": 1.8073964686998396e-05,
+      "loss": 0.0632,
+      "step": 15500
+    },
+    {
+      "epoch": 0.4992,
+      "grad_norm": 19.315397262573242,
+      "learning_rate": 1.8061123595505618e-05,
+      "loss": 0.0794,
+      "step": 15600
+    },
+    {
+      "epoch": 0.5024,
+      "grad_norm": 0.05077612027525902,
+      "learning_rate": 1.8048282504012842e-05,
+      "loss": 0.0848,
+      "step": 15700
+    },
+    {
+      "epoch": 0.5056,
+      "grad_norm": 0.33186858892440796,
+      "learning_rate": 1.8035441412520064e-05,
+      "loss": 0.0894,
+      "step": 15800
+    },
+    {
+      "epoch": 0.5088,
+      "grad_norm": 0.26919984817504883,
+      "learning_rate": 1.802260032102729e-05,
+      "loss": 0.0801,
+      "step": 15900
+    },
+    {
+      "epoch": 0.512,
+      "grad_norm": 3.566136121749878,
+      "learning_rate": 1.800975922953451e-05,
+      "loss": 0.0754,
+      "step": 16000
+    },
+    {
+      "epoch": 0.512,
+      "eval_accuracy": 0.98201,
+      "eval_f1": 0.9820134202589396,
+      "eval_loss": 0.07791993767023087,
+      "eval_precision": 0.9820579125315673,
+      "eval_recall": 0.98201,
+      "eval_runtime": 823.0886,
+      "eval_samples_per_second": 121.494,
+      "eval_steps_per_second": 7.593,
+      "step": 16000
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 6.79459660326359e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null