Training in progress, step 24000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +296 -4

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6bedaf2b834c17d85aceaca7862c24d85d8d872107727528ad8cce968c65457d
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:63d8709297afd894af99a163299f58c25d0ecf4c1109fb33c6ca599b695c1163
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b774de3046f6c9826032946233d1806ab5688b30b35bf69f6e2c64418b1af07
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c62a5ee613bedcbe24f1782d277ddaa2c1353f7999a9b5d9c7e67060088462a
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2eaf494bdb773a56e55acb93767a950deb04425b06a47268e2a7e6eb9596f87
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:732f3f8948a77bf9ef00b9a71ed21980be5bb4dfbe32b4f3c8a750669102d82c
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d613eca09cb3ed2cbc2c00b1d0538a9bda3f76b75cb69bac8b3cf4fa9b1dda90
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:809d9e108b4a097a87eb7ca47b7d07656e83c40d06f4eb5e0ec99a3edb4019d0
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:524e618937b19fc406beb64b3f4e048c69ed7a9b18cd89552940d0d92765916b
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:23fadf64bbbf065d62df9416650b6887ec1c2b6763b291ed80fa5ee507341cf0
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -2,9 +2,9 @@
   "best_global_step": 20000,
   "best_metric": 0.9846426496660109,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-20000",
-  "epoch": 0.64,
   "eval_steps": 4000,
-  "global_step": 20000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1468,6 +1468,298 @@
       "eval_samples_per_second": 122.848,
       "eval_steps_per_second": 7.678,
       "step": 20000
     }
   ],
   "logging_steps": 100,
@@ -1482,7 +1774,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
@@ -1496,7 +1788,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 8.492350218891494e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

   "best_global_step": 20000,
   "best_metric": 0.9846426496660109,
   "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-20000",
+  "epoch": 0.768,
   "eval_steps": 4000,
+  "global_step": 24000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 122.848,
       "eval_steps_per_second": 7.678,
       "step": 20000
+    },
+    {
+      "epoch": 0.6432,
+      "grad_norm": 25.919387817382812,
+      "learning_rate": 1.7483274478330657e-05,
+      "loss": 0.0704,
+      "step": 20100
+    },
+    {
+      "epoch": 0.6464,
+      "grad_norm": 0.27127301692962646,
+      "learning_rate": 1.7470433386837882e-05,
+      "loss": 0.0749,
+      "step": 20200
+    },
+    {
+      "epoch": 0.6496,
+      "grad_norm": 0.1059252917766571,
+      "learning_rate": 1.7457592295345103e-05,
+      "loss": 0.0793,
+      "step": 20300
+    },
+    {
+      "epoch": 0.6528,
+      "grad_norm": 0.6019250154495239,
+      "learning_rate": 1.7444751203852328e-05,
+      "loss": 0.059,
+      "step": 20400
+    },
+    {
+      "epoch": 0.656,
+      "grad_norm": 0.28291046619415283,
+      "learning_rate": 1.7431910112359553e-05,
+      "loss": 0.0569,
+      "step": 20500
+    },
+    {
+      "epoch": 0.6592,
+      "grad_norm": 0.15100154280662537,
+      "learning_rate": 1.7419069020866774e-05,
+      "loss": 0.0398,
+      "step": 20600
+    },
+    {
+      "epoch": 0.6624,
+      "grad_norm": 0.017900506034493446,
+      "learning_rate": 1.7406227929374e-05,
+      "loss": 0.0559,
+      "step": 20700
+    },
+    {
+      "epoch": 0.6656,
+      "grad_norm": 0.007751260884106159,
+      "learning_rate": 1.739338683788122e-05,
+      "loss": 0.0621,
+      "step": 20800
+    },
+    {
+      "epoch": 0.6688,
+      "grad_norm": 5.354798793792725,
+      "learning_rate": 1.7380545746388445e-05,
+      "loss": 0.085,
+      "step": 20900
+    },
+    {
+      "epoch": 0.672,
+      "grad_norm": 2.312457799911499,
+      "learning_rate": 1.7367704654895667e-05,
+      "loss": 0.0654,
+      "step": 21000
+    },
+    {
+      "epoch": 0.6752,
+      "grad_norm": 0.10008107125759125,
+      "learning_rate": 1.7354863563402892e-05,
+      "loss": 0.0697,
+      "step": 21100
+    },
+    {
+      "epoch": 0.6784,
+      "grad_norm": 0.008539400063455105,
+      "learning_rate": 1.7342022471910113e-05,
+      "loss": 0.0687,
+      "step": 21200
+    },
+    {
+      "epoch": 0.6816,
+      "grad_norm": 1.0686814785003662,
+      "learning_rate": 1.7329181380417338e-05,
+      "loss": 0.0491,
+      "step": 21300
+    },
+    {
+      "epoch": 0.6848,
+      "grad_norm": 42.248897552490234,
+      "learning_rate": 1.731634028892456e-05,
+      "loss": 0.0464,
+      "step": 21400
+    },
+    {
+      "epoch": 0.688,
+      "grad_norm": 17.70836067199707,
+      "learning_rate": 1.7303499197431784e-05,
+      "loss": 0.109,
+      "step": 21500
+    },
+    {
+      "epoch": 0.6912,
+      "grad_norm": 11.702173233032227,
+      "learning_rate": 1.7290658105939006e-05,
+      "loss": 0.0626,
+      "step": 21600
+    },
+    {
+      "epoch": 0.6944,
+      "grad_norm": 0.15207910537719727,
+      "learning_rate": 1.727781701444623e-05,
+      "loss": 0.0617,
+      "step": 21700
+    },
+    {
+      "epoch": 0.6976,
+      "grad_norm": 0.7698332667350769,
+      "learning_rate": 1.7264975922953452e-05,
+      "loss": 0.0508,
+      "step": 21800
+    },
+    {
+      "epoch": 0.7008,
+      "grad_norm": 0.012268565595149994,
+      "learning_rate": 1.7252134831460677e-05,
+      "loss": 0.0518,
+      "step": 21900
+    },
+    {
+      "epoch": 0.704,
+      "grad_norm": 0.07914119213819504,
+      "learning_rate": 1.7239293739967898e-05,
+      "loss": 0.0699,
+      "step": 22000
+    },
+    {
+      "epoch": 0.7072,
+      "grad_norm": 0.5616400241851807,
+      "learning_rate": 1.7226452648475123e-05,
+      "loss": 0.0649,
+      "step": 22100
+    },
+    {
+      "epoch": 0.7104,
+      "grad_norm": 6.950782299041748,
+      "learning_rate": 1.7213611556982345e-05,
+      "loss": 0.0719,
+      "step": 22200
+    },
+    {
+      "epoch": 0.7136,
+      "grad_norm": 0.07157002389431,
+      "learning_rate": 1.720077046548957e-05,
+      "loss": 0.0403,
+      "step": 22300
+    },
+    {
+      "epoch": 0.7168,
+      "grad_norm": 2.784773588180542,
+      "learning_rate": 1.718792937399679e-05,
+      "loss": 0.0468,
+      "step": 22400
+    },
+    {
+      "epoch": 0.72,
+      "grad_norm": 0.088102325797081,
+      "learning_rate": 1.7175088282504012e-05,
+      "loss": 0.0612,
+      "step": 22500
+    },
+    {
+      "epoch": 0.7232,
+      "grad_norm": 0.373806357383728,
+      "learning_rate": 1.7162247191011237e-05,
+      "loss": 0.0607,
+      "step": 22600
+    },
+    {
+      "epoch": 0.7264,
+      "grad_norm": 10.401127815246582,
+      "learning_rate": 1.714940609951846e-05,
+      "loss": 0.0572,
+      "step": 22700
+    },
+    {
+      "epoch": 0.7296,
+      "grad_norm": 0.006438109558075666,
+      "learning_rate": 1.7136565008025683e-05,
+      "loss": 0.0472,
+      "step": 22800
+    },
+    {
+      "epoch": 0.7328,
+      "grad_norm": 0.15433204174041748,
+      "learning_rate": 1.7123723916532905e-05,
+      "loss": 0.0578,
+      "step": 22900
+    },
+    {
+      "epoch": 0.736,
+      "grad_norm": 0.29676365852355957,
+      "learning_rate": 1.711088282504013e-05,
+      "loss": 0.0355,
+      "step": 23000
+    },
+    {
+      "epoch": 0.7392,
+      "grad_norm": 0.007739920634776354,
+      "learning_rate": 1.709804173354735e-05,
+      "loss": 0.0545,
+      "step": 23100
+    },
+    {
+      "epoch": 0.7424,
+      "grad_norm": 16.565767288208008,
+      "learning_rate": 1.7085200642054576e-05,
+      "loss": 0.0662,
+      "step": 23200
+    },
+    {
+      "epoch": 0.7456,
+      "grad_norm": 0.013131607323884964,
+      "learning_rate": 1.7072359550561797e-05,
+      "loss": 0.0734,
+      "step": 23300
+    },
+    {
+      "epoch": 0.7488,
+      "grad_norm": 1.746962308883667,
+      "learning_rate": 1.7059518459069022e-05,
+      "loss": 0.0558,
+      "step": 23400
+    },
+    {
+      "epoch": 0.752,
+      "grad_norm": 6.599545955657959,
+      "learning_rate": 1.7046677367576247e-05,
+      "loss": 0.0485,
+      "step": 23500
+    },
+    {
+      "epoch": 0.7552,
+      "grad_norm": 4.333959102630615,
+      "learning_rate": 1.703383627608347e-05,
+      "loss": 0.0554,
+      "step": 23600
+    },
+    {
+      "epoch": 0.7584,
+      "grad_norm": 0.16271114349365234,
+      "learning_rate": 1.7020995184590693e-05,
+      "loss": 0.0367,
+      "step": 23700
+    },
+    {
+      "epoch": 0.7616,
+      "grad_norm": 17.760648727416992,
+      "learning_rate": 1.7008154093097915e-05,
+      "loss": 0.0871,
+      "step": 23800
+    },
+    {
+      "epoch": 0.7648,
+      "grad_norm": 0.15831367671489716,
+      "learning_rate": 1.699531300160514e-05,
+      "loss": 0.0525,
+      "step": 23900
+    },
+    {
+      "epoch": 0.768,
+      "grad_norm": 10.259693145751953,
+      "learning_rate": 1.698247191011236e-05,
+      "loss": 0.0643,
+      "step": 24000
+    },
+    {
+      "epoch": 0.768,
+      "eval_accuracy": 0.98307,
+      "eval_f1": 0.9830752640408086,
+      "eval_loss": 0.07612209022045135,
+      "eval_precision": 0.9832125198389433,
+      "eval_recall": 0.98307,
+      "eval_runtime": 774.4597,
+      "eval_samples_per_second": 129.122,
+      "eval_steps_per_second": 8.07,
+      "step": 24000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.0191521072952346e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null