Upload folder using huggingface_hub

Browse files

Files changed (15) hide show

bert/model.safetensors +1 -1
checkpoints/checkpoint-30/model.safetensors +3 -0
checkpoints/checkpoint-30/optimizer.pt +3 -0
checkpoints/checkpoint-30/rng_state.pth +0 -0
checkpoints/checkpoint-30/scheduler.pt +3 -0
checkpoints/checkpoint-30/trainer_state.json +81 -0
checkpoints/checkpoint-30/training_args.bin +3 -0
checkpoints/checkpoint-45/model.safetensors +3 -0
checkpoints/checkpoint-45/optimizer.pt +3 -0
checkpoints/checkpoint-45/rng_state.pth +0 -0
checkpoints/checkpoint-45/scheduler.pt +3 -0
checkpoints/checkpoint-45/trainer_state.json +101 -0
checkpoints/checkpoint-45/training_args.bin +3 -0
classifier_config.json +4 -0
classifier_heads.pt +2 -2

bert/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:873c2a1de6fe216ea3e43e35b8bdbec1c66b30db1d7fc5345f21661147bedb9e
 size 265462608

 version https://git-lfs.github.com/spec/v1
+oid sha256:e7c60c6bd1e6ea9ea781888eace2387a8cac7719a0aaa6a1c8fcbedd8c9dda56
 size 265462608

checkpoints/checkpoint-30/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a30a19aff498442b477a6929256441b2dfc18f2290167f989844b50966e414fa
+size 265475800

checkpoints/checkpoint-30/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:747530fb5479ac76140ade4d45cfeda844ce8160f9740477a372a710380b29c1
+size 531012363

checkpoints/checkpoint-30/rng_state.pth ADDED Viewed

Binary file (14.5 kB). View file

checkpoints/checkpoint-30/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15920a3321e711e86e56dc0a004d00271033663edb180dbb76e7855cd403840e
+size 1465

checkpoints/checkpoint-30/trainer_state.json ADDED Viewed

	@@ -0,0 +1,81 @@

+{
+  "best_global_step": 30,
+  "best_metric": 0.9583333333333333,
+  "best_model_checkpoint": "models/refusal_classifier_bert/checkpoints/checkpoint-30",
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 30,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.6666666666666666,
+      "grad_norm": 3.4959802627563477,
+      "learning_rate": 3.6000000000000003e-06,
+      "loss": 1.2976,
+      "step": 10
+    },
+    {
+      "epoch": 1.0,
+      "eval_avg_accuracy": 0.7083333333333334,
+      "eval_explanation_accuracy": 0.5833333333333334,
+      "eval_explanation_f1": 0.07407407407407407,
+      "eval_loss": 1.1716887950897217,
+      "eval_refusal_accuracy": 0.8333333333333334,
+      "eval_refusal_f1": 0.875,
+      "eval_runtime": 0.1483,
+      "eval_samples_per_second": 404.703,
+      "eval_steps_per_second": 26.98,
+      "step": 15
+    },
+    {
+      "epoch": 1.3333333333333333,
+      "grad_norm": 5.753523349761963,
+      "learning_rate": 7.600000000000001e-06,
+      "loss": 1.1349,
+      "step": 20
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 5.5270490646362305,
+      "learning_rate": 1.16e-05,
+      "loss": 0.7267,
+      "step": 30
+    },
+    {
+      "epoch": 2.0,
+      "eval_avg_accuracy": 0.9583333333333333,
+      "eval_explanation_accuracy": 0.9833333333333333,
+      "eval_explanation_f1": 0.9803921568627451,
+      "eval_loss": 0.47130146622657776,
+      "eval_refusal_accuracy": 0.9333333333333333,
+      "eval_refusal_f1": 0.9459459459459459,
+      "eval_runtime": 0.1059,
+      "eval_samples_per_second": 566.428,
+      "eval_steps_per_second": 37.762,
+      "step": 30
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 45,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoints/checkpoint-30/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:014075be7b60ec5413be99d1f0c5281c647f820e81fd19badc14a7417de3575a
+size 5841

checkpoints/checkpoint-45/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:121b77670648bf437774333341d81f81ad8463b9f44927a239a0a43e5e2792e2
+size 265475800

checkpoints/checkpoint-45/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7c967d3a68387f696fe7f283307eb62563419c66eeaa0fda4a3dbc6185da5c0
+size 531012363

checkpoints/checkpoint-45/rng_state.pth ADDED Viewed

Binary file (14.5 kB). View file

checkpoints/checkpoint-45/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc3b0c8f148ee869beb8b03b3564737df8ec6bf57122343ef646ea6f10946369
+size 1465

checkpoints/checkpoint-45/trainer_state.json ADDED Viewed

	@@ -0,0 +1,101 @@

+{
+  "best_global_step": 45,
+  "best_metric": 0.9833333333333333,
+  "best_model_checkpoint": "models/refusal_classifier_bert/checkpoints/checkpoint-45",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 45,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.6666666666666666,
+      "grad_norm": 3.4959802627563477,
+      "learning_rate": 3.6000000000000003e-06,
+      "loss": 1.2976,
+      "step": 10
+    },
+    {
+      "epoch": 1.0,
+      "eval_avg_accuracy": 0.7083333333333334,
+      "eval_explanation_accuracy": 0.5833333333333334,
+      "eval_explanation_f1": 0.07407407407407407,
+      "eval_loss": 1.1716887950897217,
+      "eval_refusal_accuracy": 0.8333333333333334,
+      "eval_refusal_f1": 0.875,
+      "eval_runtime": 0.1483,
+      "eval_samples_per_second": 404.703,
+      "eval_steps_per_second": 26.98,
+      "step": 15
+    },
+    {
+      "epoch": 1.3333333333333333,
+      "grad_norm": 5.753523349761963,
+      "learning_rate": 7.600000000000001e-06,
+      "loss": 1.1349,
+      "step": 20
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 5.5270490646362305,
+      "learning_rate": 1.16e-05,
+      "loss": 0.7267,
+      "step": 30
+    },
+    {
+      "epoch": 2.0,
+      "eval_avg_accuracy": 0.9583333333333333,
+      "eval_explanation_accuracy": 0.9833333333333333,
+      "eval_explanation_f1": 0.9803921568627451,
+      "eval_loss": 0.47130146622657776,
+      "eval_refusal_accuracy": 0.9333333333333333,
+      "eval_refusal_f1": 0.9459459459459459,
+      "eval_runtime": 0.1059,
+      "eval_samples_per_second": 566.428,
+      "eval_steps_per_second": 37.762,
+      "step": 30
+    },
+    {
+      "epoch": 2.6666666666666665,
+      "grad_norm": 1.8675131797790527,
+      "learning_rate": 1.5600000000000003e-05,
+      "loss": 0.2737,
+      "step": 40
+    },
+    {
+      "epoch": 3.0,
+      "eval_avg_accuracy": 0.9833333333333333,
+      "eval_explanation_accuracy": 0.9833333333333333,
+      "eval_explanation_f1": 0.9803921568627451,
+      "eval_loss": 0.10874374210834503,
+      "eval_refusal_accuracy": 0.9833333333333333,
+      "eval_refusal_f1": 0.9859154929577465,
+      "eval_runtime": 0.116,
+      "eval_samples_per_second": 517.433,
+      "eval_steps_per_second": 34.496,
+      "step": 45
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 45,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 0.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoints/checkpoint-45/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:014075be7b60ec5413be99d1f0c5281c647f820e81fd19badc14a7417de3575a
+size 5841

classifier_config.json ADDED Viewed

	@@ -0,0 +1,4 @@

+{
+  "model_name": "distilbert-base-uncased",
+  "max_length": 128
+}

classifier_heads.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:32e8c6b3b594fadc8b878b1975c3f81c2bef69bae5470d6e1030225975780859
-size 14967

 version https://git-lfs.github.com/spec/v1
+oid sha256:94d5e88f9e544f875e6595a4f2f96b1e2397325fb86043cc8eb0007614712398
+size 14839