Training in progress, step 12000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +298 -6

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:74cf435fb7349e8e54506ebb58af01f10261a616a326d059cbcdb64543d5c394
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:22bd38c8f37046bd62018eb7378b2b711b978047511760c0db69629ca9b301ad
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43cecfb928f24cc675ff75e697b1a84f4a59512dbd7a99046461ca8ee5703f8c
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:118eb527e3f3d95f6bbf2dc9c4c0579763f722fb5753842653cc84555c706dc2
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f4a3b1d656476cd8e63479b6c20bd7983f231b968166731d8e9104d57790327
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ae035518883f7d805914f164f0380793c8a3934e907b1f7143d4918513187a8
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2fbc30c3a1fa2f1322da3a27761ccd07ada09d565f84aed41120ff0a6bec6f17
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a1d6e49e1244c2136fab7f3074345ca5593ed632d4d0d6d129c6fe8e480d66c
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a70ea2ab6fa7c8143ca6087fc4038185a17c76d37cc14c472f1fd0dba3cd729f
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:645e796050c981f4589900a1facddd99613e38baf853710ef8a2a7fa1c39977d
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 8000,
-  "best_metric": 0.9760920422665103,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-8000",
-  "epoch": 0.256,
   "eval_steps": 4000,
-  "global_step": 8000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -592,6 +592,298 @@
       "eval_samples_per_second": 122.308,
       "eval_steps_per_second": 7.644,
       "step": 8000
     }
   ],
   "logging_steps": 100,
@@ -620,7 +912,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 3.397795082747213e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 12000,
+  "best_metric": 0.97856556986665,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-12000",
+  "epoch": 0.384,
   "eval_steps": 4000,
+  "global_step": 12000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 122.308,
       "eval_steps_per_second": 7.644,
       "step": 8000
+    },
+    {
+      "epoch": 0.2592,
+      "grad_norm": 6.723151206970215,
+      "learning_rate": 1.9024205457463887e-05,
+      "loss": 0.0799,
+      "step": 8100
+    },
+    {
+      "epoch": 0.2624,
+      "grad_norm": 1.805972933769226,
+      "learning_rate": 1.901136436597111e-05,
+      "loss": 0.1211,
+      "step": 8200
+    },
+    {
+      "epoch": 0.2656,
+      "grad_norm": 11.118502616882324,
+      "learning_rate": 1.8998523274478334e-05,
+      "loss": 0.0916,
+      "step": 8300
+    },
+    {
+      "epoch": 0.2688,
+      "grad_norm": 2.3953633308410645,
+      "learning_rate": 1.8985682182985555e-05,
+      "loss": 0.0878,
+      "step": 8400
+    },
+    {
+      "epoch": 0.272,
+      "grad_norm": 0.10008874535560608,
+      "learning_rate": 1.8972841091492777e-05,
+      "loss": 0.0868,
+      "step": 8500
+    },
+    {
+      "epoch": 0.2752,
+      "grad_norm": 0.06934285163879395,
+      "learning_rate": 1.896e-05,
+      "loss": 0.1155,
+      "step": 8600
+    },
+    {
+      "epoch": 0.2784,
+      "grad_norm": 0.3781879246234894,
+      "learning_rate": 1.8947158908507223e-05,
+      "loss": 0.0988,
+      "step": 8700
+    },
+    {
+      "epoch": 0.2816,
+      "grad_norm": 9.6624174118042,
+      "learning_rate": 1.8934317817014448e-05,
+      "loss": 0.1072,
+      "step": 8800
+    },
+    {
+      "epoch": 0.2848,
+      "grad_norm": 0.09044591337442398,
+      "learning_rate": 1.892147672552167e-05,
+      "loss": 0.1085,
+      "step": 8900
+    },
+    {
+      "epoch": 0.288,
+      "grad_norm": 0.0671633929014206,
+      "learning_rate": 1.8908635634028894e-05,
+      "loss": 0.1081,
+      "step": 9000
+    },
+    {
+      "epoch": 0.2912,
+      "grad_norm": 8.130873680114746,
+      "learning_rate": 1.8895794542536115e-05,
+      "loss": 0.0968,
+      "step": 9100
+    },
+    {
+      "epoch": 0.2944,
+      "grad_norm": 1.2537904977798462,
+      "learning_rate": 1.888295345104334e-05,
+      "loss": 0.0877,
+      "step": 9200
+    },
+    {
+      "epoch": 0.2976,
+      "grad_norm": 6.084417819976807,
+      "learning_rate": 1.887011235955056e-05,
+      "loss": 0.1022,
+      "step": 9300
+    },
+    {
+      "epoch": 0.3008,
+      "grad_norm": 6.140512943267822,
+      "learning_rate": 1.8857271268057787e-05,
+      "loss": 0.1016,
+      "step": 9400
+    },
+    {
+      "epoch": 0.304,
+      "grad_norm": 1.7347182035446167,
+      "learning_rate": 1.8844430176565008e-05,
+      "loss": 0.092,
+      "step": 9500
+    },
+    {
+      "epoch": 0.3072,
+      "grad_norm": 0.6796423196792603,
+      "learning_rate": 1.8831589085072233e-05,
+      "loss": 0.1172,
+      "step": 9600
+    },
+    {
+      "epoch": 0.3104,
+      "grad_norm": 10.664779663085938,
+      "learning_rate": 1.8818747993579454e-05,
+      "loss": 0.0808,
+      "step": 9700
+    },
+    {
+      "epoch": 0.3136,
+      "grad_norm": 0.4076235294342041,
+      "learning_rate": 1.880590690208668e-05,
+      "loss": 0.0836,
+      "step": 9800
+    },
+    {
+      "epoch": 0.3168,
+      "grad_norm": 9.418440818786621,
+      "learning_rate": 1.8793065810593904e-05,
+      "loss": 0.0675,
+      "step": 9900
+    },
+    {
+      "epoch": 0.32,
+      "grad_norm": 9.2078857421875,
+      "learning_rate": 1.8780224719101125e-05,
+      "loss": 0.0686,
+      "step": 10000
+    },
+    {
+      "epoch": 0.3232,
+      "grad_norm": 0.47173646092414856,
+      "learning_rate": 1.876738362760835e-05,
+      "loss": 0.1096,
+      "step": 10100
+    },
+    {
+      "epoch": 0.3264,
+      "grad_norm": 4.5297322273254395,
+      "learning_rate": 1.875454253611557e-05,
+      "loss": 0.098,
+      "step": 10200
+    },
+    {
+      "epoch": 0.3296,
+      "grad_norm": 5.099269866943359,
+      "learning_rate": 1.8741701444622796e-05,
+      "loss": 0.1063,
+      "step": 10300
+    },
+    {
+      "epoch": 0.3328,
+      "grad_norm": 2.588848114013672,
+      "learning_rate": 1.8728860353130018e-05,
+      "loss": 0.0989,
+      "step": 10400
+    },
+    {
+      "epoch": 0.336,
+      "grad_norm": 4.629786968231201,
+      "learning_rate": 1.8716019261637243e-05,
+      "loss": 0.1018,
+      "step": 10500
+    },
+    {
+      "epoch": 0.3392,
+      "grad_norm": 11.187308311462402,
+      "learning_rate": 1.8703178170144464e-05,
+      "loss": 0.0864,
+      "step": 10600
+    },
+    {
+      "epoch": 0.3424,
+      "grad_norm": 2.476482391357422,
+      "learning_rate": 1.869033707865169e-05,
+      "loss": 0.0744,
+      "step": 10700
+    },
+    {
+      "epoch": 0.3456,
+      "grad_norm": 17.418149948120117,
+      "learning_rate": 1.867749598715891e-05,
+      "loss": 0.1189,
+      "step": 10800
+    },
+    {
+      "epoch": 0.3488,
+      "grad_norm": 11.753310203552246,
+      "learning_rate": 1.8664654895666132e-05,
+      "loss": 0.0832,
+      "step": 10900
+    },
+    {
+      "epoch": 0.352,
+      "grad_norm": 0.41917338967323303,
+      "learning_rate": 1.8651813804173357e-05,
+      "loss": 0.1063,
+      "step": 11000
+    },
+    {
+      "epoch": 0.3552,
+      "grad_norm": 14.072111129760742,
+      "learning_rate": 1.8638972712680578e-05,
+      "loss": 0.1061,
+      "step": 11100
+    },
+    {
+      "epoch": 0.3584,
+      "grad_norm": 2.6141397953033447,
+      "learning_rate": 1.8626131621187803e-05,
+      "loss": 0.0934,
+      "step": 11200
+    },
+    {
+      "epoch": 0.3616,
+      "grad_norm": 3.1363914012908936,
+      "learning_rate": 1.8613290529695024e-05,
+      "loss": 0.0879,
+      "step": 11300
+    },
+    {
+      "epoch": 0.3648,
+      "grad_norm": 4.260811805725098,
+      "learning_rate": 1.860044943820225e-05,
+      "loss": 0.092,
+      "step": 11400
+    },
+    {
+      "epoch": 0.368,
+      "grad_norm": 0.2677570879459381,
+      "learning_rate": 1.858760834670947e-05,
+      "loss": 0.1202,
+      "step": 11500
+    },
+    {
+      "epoch": 0.3712,
+      "grad_norm": 0.056061357259750366,
+      "learning_rate": 1.8574767255216696e-05,
+      "loss": 0.0773,
+      "step": 11600
+    },
+    {
+      "epoch": 0.3744,
+      "grad_norm": 7.95279598236084,
+      "learning_rate": 1.8561926163723917e-05,
+      "loss": 0.0749,
+      "step": 11700
+    },
+    {
+      "epoch": 0.3776,
+      "grad_norm": 7.4200873374938965,
+      "learning_rate": 1.8549085072231142e-05,
+      "loss": 0.1054,
+      "step": 11800
+    },
+    {
+      "epoch": 0.3808,
+      "grad_norm": 0.8819625973701477,
+      "learning_rate": 1.8536243980738363e-05,
+      "loss": 0.0998,
+      "step": 11900
+    },
+    {
+      "epoch": 0.384,
+      "grad_norm": 6.32806396484375,
+      "learning_rate": 1.8523402889245588e-05,
+      "loss": 0.0667,
+      "step": 12000
+    },
+    {
+      "epoch": 0.384,
+      "eval_accuracy": 0.97856,
+      "eval_f1": 0.97856556986665,
+      "eval_loss": 0.1008467897772789,
+      "eval_precision": 0.9786554480535211,
+      "eval_recall": 0.97856,
+      "eval_runtime": 822.182,
+      "eval_samples_per_second": 121.628,
+      "eval_steps_per_second": 7.602,
+      "step": 12000
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 5.096626165108723e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null