Upload 12 files

Browse files

Files changed (7) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
rng_state.pth +1 -1
scaler.pt +1 -1
scheduler.pt +1 -1
trainer_state.json +24 -357
training_args.bin +1 -1

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8cb6e2b5f90f30ca52fa39f1b079d01b3a52d4c92da2990029d8adedd3888c35
 size 941352733

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9439a91d77f577a769cc49680171045b9d1d75ad5bcb4e8509c4184ef9786f0
 size 941352733

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a71e115ab9dbaf439f8aa1530a63b61061f5e5bbaee9047f8047eab12b68eeda
 size 470689133

 version https://git-lfs.github.com/spec/v1
+oid sha256:04c42607ceaf9dfb9bfdde750cb68ffce0091526954ed3c098d4e53e78b15728
 size 470689133

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:099e44fb10a95911d0067a7446b20f42c946e2d6a8fb85f841cb022b70d2fbdd
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:018ee511d461eca50aae3f96fd675ea399ab9a8fb2556ff297b2bb456934d1ef
 size 14503

scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2b5abde5bf94ca484f0d3d7e3b0e3a7fa2a2568886449ea2c54e73ad9dc57f7a
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:9c1274f79c9e460ae6bf3e5f96099845a5976fc8e53216f53bd1006019f4d32d
 size 559

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b82fd0c81ed503f64d9df5417d6e55de7835dacc9822e516f2c85e249a3d87b2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:51175e113ec240e93413ad240ccb51d582b77522feac43f869dac2af5849fece
 size 623

trainer_state.json CHANGED Viewed

@@ -1,373 +1,40 @@
 {
-  "best_metric": 0.4354366958141327,
-  "best_model_checkpoint": "safety_instruct_detect/checkpoint-29234",
-  "epoch": 1.0,
-  "global_step": 29234,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.02,
-      "learning_rate": 1.982896627214887e-05,
-      "loss": 0.5802,
-      "step": 500
-    },
-    {
-      "epoch": 0.03,
-      "learning_rate": 1.965793254429774e-05,
-      "loss": 0.5267,
-      "step": 1000
-    },
-    {
-      "epoch": 0.05,
-      "learning_rate": 1.9486898816446604e-05,
-      "loss": 0.5018,
-      "step": 1500
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 1.9315865088595472e-05,
-      "loss": 0.4908,
-      "step": 2000
-    },
-    {
-      "epoch": 0.09,
-      "learning_rate": 1.914483136074434e-05,
-      "loss": 0.4837,
-      "step": 2500
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 1.8973797632893206e-05,
-      "loss": 0.4864,
-      "step": 3000
-    },
-    {
-      "epoch": 0.12,
-      "learning_rate": 1.8802763905042078e-05,
-      "loss": 0.4747,
-      "step": 3500
-    },
-    {
-      "epoch": 0.14,
-      "learning_rate": 1.8631730177190943e-05,
-      "loss": 0.4787,
-      "step": 4000
-    },
-    {
-      "epoch": 0.15,
-      "learning_rate": 1.846103851679551e-05,
-      "loss": 0.4779,
-      "step": 4500
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 1.8290004788944384e-05,
-      "loss": 0.4713,
-      "step": 5000
-    },
-    {
-      "epoch": 0.19,
-      "learning_rate": 1.8119313128548952e-05,
-      "loss": 0.4745,
-      "step": 5500
-    },
-    {
-      "epoch": 0.21,
-      "learning_rate": 1.7948279400697817e-05,
-      "loss": 0.4712,
-      "step": 6000
-    },
-    {
-      "epoch": 0.22,
-      "learning_rate": 1.7777245672846686e-05,
-      "loss": 0.4757,
-      "step": 6500
-    },
-    {
-      "epoch": 0.24,
-      "learning_rate": 1.7606211944995554e-05,
-      "loss": 0.4725,
-      "step": 7000
-    },
-    {
-      "epoch": 0.26,
-      "learning_rate": 1.7435178217144423e-05,
-      "loss": 0.4649,
-      "step": 7500
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 1.726414448929329e-05,
-      "loss": 0.4686,
-      "step": 8000
-    },
-    {
-      "epoch": 0.29,
-      "learning_rate": 1.7093110761442157e-05,
-      "loss": 0.4661,
-      "step": 8500
-    },
-    {
-      "epoch": 0.31,
-      "learning_rate": 1.6922077033591025e-05,
-      "loss": 0.4642,
-      "step": 9000
-    },
-    {
-      "epoch": 0.32,
-      "learning_rate": 1.6751385373195594e-05,
-      "loss": 0.4638,
-      "step": 9500
-    },
-    {
-      "epoch": 0.34,
-      "learning_rate": 1.6580693712800166e-05,
-      "loss": 0.4485,
-      "step": 10000
-    },
-    {
-      "epoch": 0.36,
-      "learning_rate": 1.6409659984949035e-05,
-      "loss": 0.4648,
-      "step": 10500
-    },
-    {
-      "epoch": 0.38,
-      "learning_rate": 1.62386262570979e-05,
-      "loss": 0.4565,
-      "step": 11000
-    },
-    {
-      "epoch": 0.39,
-      "learning_rate": 1.6067592529246768e-05,
-      "loss": 0.459,
-      "step": 11500
-    },
-    {
-      "epoch": 0.41,
-      "learning_rate": 1.5896558801395637e-05,
-      "loss": 0.4559,
-      "step": 12000
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 1.5725525073544505e-05,
-      "loss": 0.45,
-      "step": 12500
-    },
-    {
-      "epoch": 0.44,
-      "learning_rate": 1.5554833413149074e-05,
-      "loss": 0.4533,
-      "step": 13000
-    },
-    {
-      "epoch": 0.46,
-      "learning_rate": 1.5383799685297943e-05,
-      "loss": 0.4578,
-      "step": 13500
-    },
-    {
-      "epoch": 0.48,
-      "learning_rate": 1.521276595744681e-05,
-      "loss": 0.4577,
-      "step": 14000
-    },
-    {
-      "epoch": 0.5,
-      "learning_rate": 1.5041732229595678e-05,
-      "loss": 0.4552,
-      "step": 14500
-    },
-    {
-      "epoch": 0.51,
-      "learning_rate": 1.4870698501744545e-05,
-      "loss": 0.4551,
-      "step": 15000
-    },
-    {
-      "epoch": 0.53,
-      "learning_rate": 1.4700006841349115e-05,
-      "loss": 0.4478,
-      "step": 15500
-    },
-    {
-      "epoch": 0.55,
-      "learning_rate": 1.4528973113497984e-05,
-      "loss": 0.4496,
-      "step": 16000
-    },
-    {
-      "epoch": 0.56,
-      "learning_rate": 1.435793938564685e-05,
-      "loss": 0.4499,
-      "step": 16500
-    },
-    {
-      "epoch": 0.58,
-      "learning_rate": 1.4186905657795717e-05,
-      "loss": 0.4403,
-      "step": 17000
-    },
-    {
-      "epoch": 0.6,
-      "learning_rate": 1.4015871929944587e-05,
-      "loss": 0.4492,
-      "step": 17500
-    },
-    {
-      "epoch": 0.62,
-      "learning_rate": 1.3844838202093454e-05,
-      "loss": 0.4447,
-      "step": 18000
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 1.3673804474242323e-05,
-      "loss": 0.4442,
-      "step": 18500
-    },
-    {
-      "epoch": 0.65,
-      "learning_rate": 1.350277074639119e-05,
-      "loss": 0.4464,
-      "step": 19000
-    },
-    {
-      "epoch": 0.67,
-      "learning_rate": 1.333207908599576e-05,
-      "loss": 0.4445,
-      "step": 19500
-    },
-    {
-      "epoch": 0.68,
-      "learning_rate": 1.3161045358144627e-05,
-      "loss": 0.4458,
-      "step": 20000
-    },
-    {
-      "epoch": 0.7,
-      "learning_rate": 1.2990011630293495e-05,
-      "loss": 0.4532,
-      "step": 20500
-    },
-    {
-      "epoch": 0.72,
-      "learning_rate": 1.2818977902442362e-05,
-      "loss": 0.4497,
-      "step": 21000
-    },
-    {
-      "epoch": 0.74,
-      "learning_rate": 1.2648286242046933e-05,
-      "loss": 0.4424,
-      "step": 21500
-    },
-    {
-      "epoch": 0.75,
-      "learning_rate": 1.2477252514195801e-05,
-      "loss": 0.4441,
-      "step": 22000
-    },
-    {
-      "epoch": 0.77,
-      "learning_rate": 1.2306218786344668e-05,
-      "loss": 0.4388,
-      "step": 22500
-    },
-    {
-      "epoch": 0.79,
-      "learning_rate": 1.2135185058493535e-05,
-      "loss": 0.4494,
-      "step": 23000
-    },
-    {
-      "epoch": 0.8,
-      "learning_rate": 1.1964493398098105e-05,
-      "loss": 0.4491,
-      "step": 23500
-    },
-    {
-      "epoch": 0.82,
-      "learning_rate": 1.1793459670246974e-05,
-      "loss": 0.4487,
-      "step": 24000
-    },
-    {
-      "epoch": 0.84,
-      "learning_rate": 1.162242594239584e-05,
-      "loss": 0.4427,
-      "step": 24500
-    },
-    {
-      "epoch": 0.86,
-      "learning_rate": 1.145139221454471e-05,
-      "loss": 0.4408,
-      "step": 25000
-    },
-    {
-      "epoch": 0.87,
-      "learning_rate": 1.128070055414928e-05,
-      "loss": 0.4492,
-      "step": 25500
-    },
-    {
-      "epoch": 0.89,
-      "learning_rate": 1.1109666826298147e-05,
-      "loss": 0.4495,
-      "step": 26000
-    },
-    {
-      "epoch": 0.91,
-      "learning_rate": 1.0938633098447015e-05,
-      "loss": 0.4483,
-      "step": 26500
-    },
-    {
-      "epoch": 0.92,
-      "learning_rate": 1.0767599370595882e-05,
-      "loss": 0.4434,
-      "step": 27000
-    },
-    {
-      "epoch": 0.94,
-      "learning_rate": 1.0596565642744749e-05,
-      "loss": 0.4378,
-      "step": 27500
-    },
-    {
-      "epoch": 0.96,
-      "learning_rate": 1.042587398234932e-05,
-      "loss": 0.4519,
-      "step": 28000
-    },
-    {
-      "epoch": 0.97,
-      "learning_rate": 1.0254840254498188e-05,
-      "loss": 0.441,
-      "step": 28500
     },
     {
-      "epoch": 0.99,
-      "learning_rate": 1.0083806526647054e-05,
-      "loss": 0.4326,
-      "step": 29000
     },
     {
-      "epoch": 1.0,
-      "eval_accuracy": 0.7976267850179198,
-      "eval_loss": 0.4354366958141327,
-      "eval_runtime": 263.852,
-      "eval_samples_per_second": 204.095,
-      "eval_steps_per_second": 5.833,
-      "step": 29234
     }
   ],
-  "max_steps": 58468,
   "num_train_epochs": 2,
-  "total_flos": 4.2074262727528664e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.09600851684808731,
+  "best_model_checkpoint": "safety_instruct_detect/checkpoint-686",
+  "epoch": 2.0,
+  "global_step": 686,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9537414965986395,
+      "eval_loss": 0.14035563170909882,
+      "eval_runtime": 35.4642,
+      "eval_samples_per_second": 145.076,
+      "eval_steps_per_second": 4.145,
+      "step": 343
     },
     {
+      "epoch": 1.46,
+      "learning_rate": 5.451895043731778e-06,
+      "loss": 0.2205,
+      "step": 500
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9706511175898931,
+      "eval_loss": 0.09600851684808731,
+      "eval_runtime": 35.524,
+      "eval_samples_per_second": 144.832,
+      "eval_steps_per_second": 4.138,
+      "step": 686
     }
   ],
+  "max_steps": 686,
   "num_train_epochs": 2,
+  "total_flos": 1291799489699544.0,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21f9e5b606ea2c856cac629d34e0a0d11fc948866e9a12e54b09e737110e159d
 size 3311

 version https://git-lfs.github.com/spec/v1
+oid sha256:98d4deafadf31d0438ab604f19beb610e72db0a0498ab53564cf1a2752fccfaf
 size 3311