Upload LoRA model and probe head for run layer_31_21152420

Browse files

Files changed (2) hide show

value_head_probes/layer_31_21152420/results.json +1 -0
value_head_probes/layer_31_21152420/training_config.json +65 -0

value_head_probes/layer_31_21152420/results.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"eval_metrics": {"eval_accuracy": 0.7589259075087021, "eval_precision": 0.7678716490658002, "eval_recall": 0.7469379691821414, "eval_f1": 0.7572601642299219, "eval_auc": 0.8348568873546631, "eval_lm_loss": 0.6357943068851124, "eval_probe_loss": 0.5860002804886211, "eval_sparsity": 0.07694313742897728, "epoch": 2.0}, "train_metrics": {"train_accuracy": 0.9852262067152782, "train_precision": 0.8141453141453141, "train_recall": 0.8904030710172745, "train_f1": 0.8505683901723505, "train_auc": 0.9954571003810048, "train_lm_loss": 0.6267710517614316, "train_probe_loss": 0.25741901919962124, "train_sparsity": 0.06836923452524038, "epoch": 2.0}}

value_head_probes/layer_31_21152420/training_config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+    "model_name": "meta-llama/Meta-Llama-3.1-8B-Instruct",
+    "layer": 31,
+    "adapter_dir": "/root/hallucination_detection/value_head_probes/layer_31_21152420",
+    "train_split": 0.8,
+    "dtype": "torch.bfloat16",
+    "overwrite_output_dir": true,
+    "max_steps": -1,
+    "num_train_epochs": 2,
+    "per_device_train_batch_size": 2,
+    "per_device_eval_batch_size": 2,
+    "lambda_lm": 0.1,
+    "logging_steps": 20,
+    "eval_steps": 100,
+    "overfit_mode": false,
+    "lora_layers": [
+        0,
+        1,
+        2,
+        3,
+        4,
+        5,
+        6,
+        7,
+        8,
+        9,
+        10,
+        11,
+        12,
+        13,
+        14,
+        15,
+        16,
+        17,
+        18,
+        19,
+        20,
+        21,
+        22,
+        23,
+        24,
+        25,
+        26,
+        27,
+        28,
+        29,
+        30,
+        31
+    ],
+    "lora_r": 32,
+    "lora_alpha": 64,
+    "lora_dropout": 0.05,
+    "upload_to_hf": true,
+    "load_from_hf": false,
+    "probe_threshold": 0.5,
+    "hf_repo": "obalcells/labeled-entity-facts",
+    "dataset_name": "longfact",
+    "max_length": 1200,
+    "default_ignore": false,
+    "pos_weight": 10.0,
+    "neg_weight": 10.0,
+    "ignore_window_size": 5,
+    "shuffle": true,
+    "seed": 42
+}