Training in progress, step 44000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +299 -7

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:33f0f667a5193eb4d35b243c5c1df790f53411abe8add627f8801dc7a6e453fb
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:16dadfb9608dcaa99e56c16537431ef4528e7f7edc4ac58dfea4bb46f7e1c8a9
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:338d656c8c08afe1535666116a30ec6c8bc16d2218bd3572b0ad6095b0a6fc86
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:2a2d226450cdcebcf2615a1d39959652fe5438e10e2d6cd2cb8d2468a792f8b2
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f75ef4c1eb025b45e99753eb3086841a7a2849ad71d5bd6afa88ad76ffcffe8a
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:97462624a2fc53c8574a0620aac025280c9bdbbb7138ff03f47f37018b457bf4
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:00b9e9e803d002d2b860a18a7caf54803f3c31024a6925df1ba4a7df5d623e98
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:7e9a989616374c693d6e283e9a661c77047898be59d9e06a73f69b65c271f395
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:90b69642bdda2390c9b2aaa786137796ae481637fe31199c160a1cb107e6720e
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:7880c38c083e20dc3aacb94693eef3b1547dc3e69aff0279d80323326c2ebc49
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 36000,
-  "best_metric": 0.9893807849919393,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-36000",
-  "epoch": 1.28,
   "eval_steps": 4000,
-  "global_step": 40000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2928,6 +2928,298 @@
       "eval_samples_per_second": 128.613,
       "eval_steps_per_second": 8.038,
       "step": 40000
     }
   ],
   "logging_steps": 100,
@@ -2942,7 +3234,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
@@ -2956,7 +3248,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.698520718775022e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 44000,
+  "best_metric": 0.9900904784547742,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-44000",
+  "epoch": 1.408,
   "eval_steps": 4000,
+  "global_step": 44000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 128.613,
       "eval_steps_per_second": 8.038,
       "step": 40000
+    },
+    {
+      "epoch": 1.2832,
+      "grad_norm": 0.879464328289032,
+      "learning_rate": 1.4915056179775283e-05,
+      "loss": 0.0371,
+      "step": 40100
+    },
+    {
+      "epoch": 1.2864,
+      "grad_norm": 0.5318993926048279,
+      "learning_rate": 1.4902215088282506e-05,
+      "loss": 0.0638,
+      "step": 40200
+    },
+    {
+      "epoch": 1.2896,
+      "grad_norm": 0.024928994476795197,
+      "learning_rate": 1.4889373996789729e-05,
+      "loss": 0.039,
+      "step": 40300
+    },
+    {
+      "epoch": 1.2928,
+      "grad_norm": 15.540450096130371,
+      "learning_rate": 1.4876532905296952e-05,
+      "loss": 0.0392,
+      "step": 40400
+    },
+    {
+      "epoch": 1.296,
+      "grad_norm": 3.986953020095825,
+      "learning_rate": 1.4863691813804175e-05,
+      "loss": 0.0518,
+      "step": 40500
+    },
+    {
+      "epoch": 1.2992,
+      "grad_norm": 0.03195634484291077,
+      "learning_rate": 1.4850850722311398e-05,
+      "loss": 0.0614,
+      "step": 40600
+    },
+    {
+      "epoch": 1.3024,
+      "grad_norm": 0.004710075911134481,
+      "learning_rate": 1.4838009630818621e-05,
+      "loss": 0.0384,
+      "step": 40700
+    },
+    {
+      "epoch": 1.3056,
+      "grad_norm": 0.08971494436264038,
+      "learning_rate": 1.4825168539325845e-05,
+      "loss": 0.051,
+      "step": 40800
+    },
+    {
+      "epoch": 1.3088,
+      "grad_norm": 0.00958671048283577,
+      "learning_rate": 1.4812327447833068e-05,
+      "loss": 0.042,
+      "step": 40900
+    },
+    {
+      "epoch": 1.312,
+      "grad_norm": 26.961130142211914,
+      "learning_rate": 1.4799486356340289e-05,
+      "loss": 0.0512,
+      "step": 41000
+    },
+    {
+      "epoch": 1.3152,
+      "grad_norm": 0.12558290362358093,
+      "learning_rate": 1.4786645264847512e-05,
+      "loss": 0.0262,
+      "step": 41100
+    },
+    {
+      "epoch": 1.3184,
+      "grad_norm": 0.020398223772644997,
+      "learning_rate": 1.4773804173354735e-05,
+      "loss": 0.0504,
+      "step": 41200
+    },
+    {
+      "epoch": 1.3216,
+      "grad_norm": 0.04079282656311989,
+      "learning_rate": 1.4760963081861959e-05,
+      "loss": 0.0467,
+      "step": 41300
+    },
+    {
+      "epoch": 1.3248,
+      "grad_norm": 0.01801035739481449,
+      "learning_rate": 1.4748121990369182e-05,
+      "loss": 0.031,
+      "step": 41400
+    },
+    {
+      "epoch": 1.328,
+      "grad_norm": 19.165552139282227,
+      "learning_rate": 1.4735280898876405e-05,
+      "loss": 0.0425,
+      "step": 41500
+    },
+    {
+      "epoch": 1.3312,
+      "grad_norm": 0.06247144564986229,
+      "learning_rate": 1.4722439807383628e-05,
+      "loss": 0.0377,
+      "step": 41600
+    },
+    {
+      "epoch": 1.3344,
+      "grad_norm": 0.07584625482559204,
+      "learning_rate": 1.4709598715890851e-05,
+      "loss": 0.0318,
+      "step": 41700
+    },
+    {
+      "epoch": 1.3376000000000001,
+      "grad_norm": 0.659372866153717,
+      "learning_rate": 1.4696757624398074e-05,
+      "loss": 0.0392,
+      "step": 41800
+    },
+    {
+      "epoch": 1.3408,
+      "grad_norm": 0.027756713330745697,
+      "learning_rate": 1.4683916532905297e-05,
+      "loss": 0.0518,
+      "step": 41900
+    },
+    {
+      "epoch": 1.3439999999999999,
+      "grad_norm": 0.006904853507876396,
+      "learning_rate": 1.467107544141252e-05,
+      "loss": 0.0456,
+      "step": 42000
+    },
+    {
+      "epoch": 1.3472,
+      "grad_norm": 0.005585466045886278,
+      "learning_rate": 1.4658234349919744e-05,
+      "loss": 0.046,
+      "step": 42100
+    },
+    {
+      "epoch": 1.3504,
+      "grad_norm": 5.473335266113281,
+      "learning_rate": 1.4645393258426967e-05,
+      "loss": 0.0428,
+      "step": 42200
+    },
+    {
+      "epoch": 1.3536000000000001,
+      "grad_norm": 10.384184837341309,
+      "learning_rate": 1.4632552166934192e-05,
+      "loss": 0.0512,
+      "step": 42300
+    },
+    {
+      "epoch": 1.3568,
+      "grad_norm": 4.152897357940674,
+      "learning_rate": 1.4619711075441415e-05,
+      "loss": 0.0378,
+      "step": 42400
+    },
+    {
+      "epoch": 1.3599999999999999,
+      "grad_norm": 0.06695935130119324,
+      "learning_rate": 1.4606869983948638e-05,
+      "loss": 0.0411,
+      "step": 42500
+    },
+    {
+      "epoch": 1.3632,
+      "grad_norm": 21.025299072265625,
+      "learning_rate": 1.4594028892455861e-05,
+      "loss": 0.0373,
+      "step": 42600
+    },
+    {
+      "epoch": 1.3664,
+      "grad_norm": 13.606021881103516,
+      "learning_rate": 1.4581187800963084e-05,
+      "loss": 0.0454,
+      "step": 42700
+    },
+    {
+      "epoch": 1.3696,
+      "grad_norm": 0.17352361977100372,
+      "learning_rate": 1.4568346709470307e-05,
+      "loss": 0.0513,
+      "step": 42800
+    },
+    {
+      "epoch": 1.3728,
+      "grad_norm": 1.2343215942382812,
+      "learning_rate": 1.455550561797753e-05,
+      "loss": 0.0699,
+      "step": 42900
+    },
+    {
+      "epoch": 1.376,
+      "grad_norm": 0.01240515150129795,
+      "learning_rate": 1.4542664526484754e-05,
+      "loss": 0.0402,
+      "step": 43000
+    },
+    {
+      "epoch": 1.3792,
+      "grad_norm": 5.457210063934326,
+      "learning_rate": 1.4529823434991977e-05,
+      "loss": 0.0519,
+      "step": 43100
+    },
+    {
+      "epoch": 1.3824,
+      "grad_norm": 0.8150522708892822,
+      "learning_rate": 1.45169823434992e-05,
+      "loss": 0.0605,
+      "step": 43200
+    },
+    {
+      "epoch": 1.3856,
+      "grad_norm": 0.046282608062028885,
+      "learning_rate": 1.4504141252006421e-05,
+      "loss": 0.0523,
+      "step": 43300
+    },
+    {
+      "epoch": 1.3888,
+      "grad_norm": 0.009331628680229187,
+      "learning_rate": 1.4491300160513644e-05,
+      "loss": 0.0453,
+      "step": 43400
+    },
+    {
+      "epoch": 1.392,
+      "grad_norm": 0.15661238133907318,
+      "learning_rate": 1.4478459069020868e-05,
+      "loss": 0.0303,
+      "step": 43500
+    },
+    {
+      "epoch": 1.3952,
+      "grad_norm": 5.842204570770264,
+      "learning_rate": 1.446561797752809e-05,
+      "loss": 0.0369,
+      "step": 43600
+    },
+    {
+      "epoch": 1.3984,
+      "grad_norm": 32.753719329833984,
+      "learning_rate": 1.4452776886035314e-05,
+      "loss": 0.0423,
+      "step": 43700
+    },
+    {
+      "epoch": 1.4016,
+      "grad_norm": 0.0857323631644249,
+      "learning_rate": 1.4439935794542537e-05,
+      "loss": 0.0452,
+      "step": 43800
+    },
+    {
+      "epoch": 1.4048,
+      "grad_norm": 0.03770207613706589,
+      "learning_rate": 1.442709470304976e-05,
+      "loss": 0.0455,
+      "step": 43900
+    },
+    {
+      "epoch": 1.408,
+      "grad_norm": 0.10206503421068192,
+      "learning_rate": 1.4414253611556983e-05,
+      "loss": 0.0423,
+      "step": 44000
+    },
+    {
+      "epoch": 1.408,
+      "eval_accuracy": 0.99009,
+      "eval_f1": 0.9900904784547742,
+      "eval_loss": 0.03986356034874916,
+      "eval_precision": 0.9900932283159651,
+      "eval_recall": 0.99009,
+      "eval_runtime": 775.1079,
+      "eval_samples_per_second": 129.014,
+      "eval_steps_per_second": 8.063,
+      "step": 44000
     }
   ],
   "logging_steps": 100,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 1.8683917813152307e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null