Training in progress, step 36000, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/adapter_model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +298 -6

last-checkpoint/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f5cafd52307ebb0d4ad02660f4fa895f4176ab48ccb18d8698902129b3b1209
 size 3555504

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4a4b1c16a17272dd3d5d44145b877d0c14dc6e19c78bd41637a76bc87a0e7ea
 size 3555504

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:26d3696bade1cccaee17e0a3be137fdd3e3380bab51d20a657d51f20328ef6ef
 size 7141515

 version https://git-lfs.github.com/spec/v1
+oid sha256:68ca690b9a0c619477d3038e9b1f2189091b893c636b800c671b19aeb6d28dba
 size 7141515

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:819540c05377c6a98947b46ab098a8f4456dd635badbf1ea38d292430af1a819
 size 14645

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d04e325551f27b0abb1677ad51b5250cc6db4cb37a98cc2cc710661788306e4
 size 14645

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1d960d60d0c4ed45cc4422d14d1920d93529483656b6082492613ed8fd865f5f
 size 1383

 version https://git-lfs.github.com/spec/v1
+oid sha256:eba75c9103403d8e6ccb33e21824c3bb41c5512582b8b3e0415b8a731bc74943
 size 1383

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25361f5602fa6c5f9d3627497e44e73d38bd7e5fabd543717ca1fb3c15c5a95b
 size 1465

 version https://git-lfs.github.com/spec/v1
+oid sha256:4bef14adf96a5be9d64a1df76f457ac5b2fcd08c7a9b48176945077bc67a3f2f
 size 1465

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 32000,
-  "best_metric": 0.9879419419991998,
-  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-32000",
-  "epoch": 1.024,
   "eval_steps": 4000,
-  "global_step": 32000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -2344,6 +2344,298 @@
       "eval_samples_per_second": 128.957,
       "eval_steps_per_second": 8.06,
       "step": 32000
     }
   ],
   "logging_steps": 100,
@@ -2372,7 +2664,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 1.3588330900845235e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 36000,
+  "best_metric": 0.9893807849919393,
+  "best_model_checkpoint": "CodeGenDetect-CodeBert_Lora/checkpoint-36000",
+  "epoch": 1.152,
   "eval_steps": 4000,
+  "global_step": 36000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 128.957,
       "eval_steps_per_second": 8.06,
       "step": 32000
+    },
+    {
+      "epoch": 1.0272,
+      "grad_norm": 1.0557373762130737,
+      "learning_rate": 1.5942343499197433e-05,
+      "loss": 0.0594,
+      "step": 32100
+    },
+    {
+      "epoch": 1.0304,
+      "grad_norm": 0.03562343493103981,
+      "learning_rate": 1.5929502407704655e-05,
+      "loss": 0.0537,
+      "step": 32200
+    },
+    {
+      "epoch": 1.0336,
+      "grad_norm": 0.06482692807912827,
+      "learning_rate": 1.591666131621188e-05,
+      "loss": 0.0463,
+      "step": 32300
+    },
+    {
+      "epoch": 1.0368,
+      "grad_norm": 0.49017927050590515,
+      "learning_rate": 1.59038202247191e-05,
+      "loss": 0.0661,
+      "step": 32400
+    },
+    {
+      "epoch": 1.04,
+      "grad_norm": 15.849417686462402,
+      "learning_rate": 1.5890979133226326e-05,
+      "loss": 0.0237,
+      "step": 32500
+    },
+    {
+      "epoch": 1.0432,
+      "grad_norm": 0.6910932064056396,
+      "learning_rate": 1.5878138041733547e-05,
+      "loss": 0.0383,
+      "step": 32600
+    },
+    {
+      "epoch": 1.0464,
+      "grad_norm": 0.06304027885198593,
+      "learning_rate": 1.5865296950240772e-05,
+      "loss": 0.0541,
+      "step": 32700
+    },
+    {
+      "epoch": 1.0496,
+      "grad_norm": 11.758397102355957,
+      "learning_rate": 1.5852455858747994e-05,
+      "loss": 0.0573,
+      "step": 32800
+    },
+    {
+      "epoch": 1.0528,
+      "grad_norm": 0.007580827921628952,
+      "learning_rate": 1.583961476725522e-05,
+      "loss": 0.0551,
+      "step": 32900
+    },
+    {
+      "epoch": 1.056,
+      "grad_norm": 0.7389895915985107,
+      "learning_rate": 1.582677367576244e-05,
+      "loss": 0.0408,
+      "step": 33000
+    },
+    {
+      "epoch": 1.0592,
+      "grad_norm": 0.011490071192383766,
+      "learning_rate": 1.5813932584269665e-05,
+      "loss": 0.0474,
+      "step": 33100
+    },
+    {
+      "epoch": 1.0624,
+      "grad_norm": 0.00892989058047533,
+      "learning_rate": 1.5801091492776886e-05,
+      "loss": 0.0338,
+      "step": 33200
+    },
+    {
+      "epoch": 1.0656,
+      "grad_norm": 0.21890480816364288,
+      "learning_rate": 1.578825040128411e-05,
+      "loss": 0.0465,
+      "step": 33300
+    },
+    {
+      "epoch": 1.0688,
+      "grad_norm": 20.05085563659668,
+      "learning_rate": 1.5775409309791332e-05,
+      "loss": 0.0633,
+      "step": 33400
+    },
+    {
+      "epoch": 1.072,
+      "grad_norm": 3.5141100883483887,
+      "learning_rate": 1.5762568218298557e-05,
+      "loss": 0.0743,
+      "step": 33500
+    },
+    {
+      "epoch": 1.0752,
+      "grad_norm": 0.03382471203804016,
+      "learning_rate": 1.5749727126805782e-05,
+      "loss": 0.0409,
+      "step": 33600
+    },
+    {
+      "epoch": 1.0784,
+      "grad_norm": 9.916868209838867,
+      "learning_rate": 1.5736886035313004e-05,
+      "loss": 0.0498,
+      "step": 33700
+    },
+    {
+      "epoch": 1.0816,
+      "grad_norm": 0.007973396219313145,
+      "learning_rate": 1.572404494382023e-05,
+      "loss": 0.0399,
+      "step": 33800
+    },
+    {
+      "epoch": 1.0848,
+      "grad_norm": 0.15778931975364685,
+      "learning_rate": 1.571120385232745e-05,
+      "loss": 0.0406,
+      "step": 33900
+    },
+    {
+      "epoch": 1.088,
+      "grad_norm": 0.027699623256921768,
+      "learning_rate": 1.569836276083467e-05,
+      "loss": 0.0481,
+      "step": 34000
+    },
+    {
+      "epoch": 1.0912,
+      "grad_norm": 2.7082841396331787,
+      "learning_rate": 1.5685521669341893e-05,
+      "loss": 0.0427,
+      "step": 34100
+    },
+    {
+      "epoch": 1.0944,
+      "grad_norm": 2.933098316192627,
+      "learning_rate": 1.5672680577849118e-05,
+      "loss": 0.0605,
+      "step": 34200
+    },
+    {
+      "epoch": 1.0976,
+      "grad_norm": 5.093338489532471,
+      "learning_rate": 1.5659839486356342e-05,
+      "loss": 0.0625,
+      "step": 34300
+    },
+    {
+      "epoch": 1.1008,
+      "grad_norm": 0.14764878153800964,
+      "learning_rate": 1.5646998394863564e-05,
+      "loss": 0.0467,
+      "step": 34400
+    },
+    {
+      "epoch": 1.104,
+      "grad_norm": 0.45360442996025085,
+      "learning_rate": 1.563415730337079e-05,
+      "loss": 0.0517,
+      "step": 34500
+    },
+    {
+      "epoch": 1.1072,
+      "grad_norm": 0.007702784612774849,
+      "learning_rate": 1.562131621187801e-05,
+      "loss": 0.0367,
+      "step": 34600
+    },
+    {
+      "epoch": 1.1104,
+      "grad_norm": 0.01513522956520319,
+      "learning_rate": 1.5608475120385235e-05,
+      "loss": 0.0514,
+      "step": 34700
+    },
+    {
+      "epoch": 1.1136,
+      "grad_norm": 0.29241982102394104,
+      "learning_rate": 1.5595634028892456e-05,
+      "loss": 0.0428,
+      "step": 34800
+    },
+    {
+      "epoch": 1.1168,
+      "grad_norm": 0.02503369376063347,
+      "learning_rate": 1.558279293739968e-05,
+      "loss": 0.0583,
+      "step": 34900
+    },
+    {
+      "epoch": 1.12,
+      "grad_norm": 0.094393789768219,
+      "learning_rate": 1.5569951845906903e-05,
+      "loss": 0.0636,
+      "step": 35000
+    },
+    {
+      "epoch": 1.1232,
+      "grad_norm": 0.011400578543543816,
+      "learning_rate": 1.5557110754414127e-05,
+      "loss": 0.0392,
+      "step": 35100
+    },
+    {
+      "epoch": 1.1264,
+      "grad_norm": 0.015260876156389713,
+      "learning_rate": 1.554426966292135e-05,
+      "loss": 0.0452,
+      "step": 35200
+    },
+    {
+      "epoch": 1.1296,
+      "grad_norm": 0.07425595074892044,
+      "learning_rate": 1.5531428571428574e-05,
+      "loss": 0.0506,
+      "step": 35300
+    },
+    {
+      "epoch": 1.1328,
+      "grad_norm": 2.20249605178833,
+      "learning_rate": 1.5518587479935795e-05,
+      "loss": 0.0742,
+      "step": 35400
+    },
+    {
+      "epoch": 1.1360000000000001,
+      "grad_norm": 0.027821656316518784,
+      "learning_rate": 1.550574638844302e-05,
+      "loss": 0.062,
+      "step": 35500
+    },
+    {
+      "epoch": 1.1392,
+      "grad_norm": 0.02665848284959793,
+      "learning_rate": 1.549290529695024e-05,
+      "loss": 0.0739,
+      "step": 35600
+    },
+    {
+      "epoch": 1.1424,
+      "grad_norm": 5.973049163818359,
+      "learning_rate": 1.5480064205457466e-05,
+      "loss": 0.0504,
+      "step": 35700
+    },
+    {
+      "epoch": 1.1456,
+      "grad_norm": 10.988951683044434,
+      "learning_rate": 1.5467223113964688e-05,
+      "loss": 0.0493,
+      "step": 35800
+    },
+    {
+      "epoch": 1.1488,
+      "grad_norm": 15.630033493041992,
+      "learning_rate": 1.5454382022471913e-05,
+      "loss": 0.0492,
+      "step": 35900
+    },
+    {
+      "epoch": 1.152,
+      "grad_norm": 4.891533851623535,
+      "learning_rate": 1.5441540930979134e-05,
+      "loss": 0.0427,
+      "step": 36000
+    },
+    {
+      "epoch": 1.152,
+      "eval_accuracy": 0.98938,
+      "eval_f1": 0.9893807849919393,
+      "eval_loss": 0.0424417182803154,
+      "eval_precision": 0.9893870324245919,
+      "eval_recall": 0.98938,
+      "eval_runtime": 778.7856,
+      "eval_samples_per_second": 128.405,
+      "eval_steps_per_second": 8.025,
+      "step": 36000
     }
   ],
   "logging_steps": 100,
       "attributes": {}
     }
   },
+  "total_flos": 1.528656883652379e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null