Train math/qwen2.5-0.5b/math_1pct_seed0: nonleaked=1.600%

Files changed (3) hide show

math/qwen2.5-0.5b/math_1pct_seed0/metrics.json CHANGED Viewed

@@ -2,12 +2,12 @@
   "epoch_metrics": [
     {
       "epoch": 1,
-      "train_loss": 3.0199907715517917,
-      "nonleaked_acc": 0.01,
-      "leaked_acc": 0.6222222222222222,
-      "delta_acc": 0.6122222222222222
     }
   ],
-  "final_nonleaked_acc": 0.01,
-  "final_leaked_acc": 0.6222222222222222
 }

   "epoch_metrics": [
     {
       "epoch": 1,
+      "train_loss": 3.0199544944746726,
+      "nonleaked_acc": 0.016,
+      "leaked_acc": 0.5555555555555556,
+      "delta_acc": 0.5395555555555556
     }
   ],
+  "final_nonleaked_acc": 0.016,
+  "final_leaked_acc": 0.5555555555555556
 }

math/qwen2.5-0.5b/math_1pct_seed0/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25c828ca48958b0c5ea8910e295a03d2b0cbb0baf4fc283d19969fee6c43a74b
 size 988097824

 version https://git-lfs.github.com/spec/v1
+oid sha256:1436330b1d025f1bf3eccbf17adde1dd57668fc60554de4336e422073089705a
 size 988097824

math/qwen2.5-0.5b/math_1pct_seed0/train_config.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "model_key": "math/qwen2.5-0.5b/math_1pct_seed0",
   "config_hash": "5bf2c80fb7bc49a0e3931f2ac5076b4d6048d9dccac27f8b7bf973617e70cdb9",
   "config_path": "evals/math/qwen2.5-0.5b/math_1pct_seed0/config.json",
-  "eval_results_path": "evals/math/qwen2.5-0.5b/math_1pct_seed0/eval_results.jsonl",
   "base_model": "Qwen/Qwen2.5-0.5B",
   "mode": "contaminated",
   "epochs": 1,
@@ -13,9 +13,9 @@
   "n_params": 494032768,
   "proxy_dataset": "openwebtext/subset_20M_seed0.jsonl",
   "train_data_manifest": "training_pools/math_1pct_seed0_owt20M_K100_shuffle0.jsonl",
-  "wandb_run_url": "https://wandb.ai/nlp_and_interpretability/stride-applications-math/runs/6j2zdeqf",
-  "git_commit": "da09e1d",
-  "timestamp": "2026-04-25T17:40:21.084187+00:00",
   "benchmark": "math",
   "rate": 0.01,
   "seed": 0,

   "model_key": "math/qwen2.5-0.5b/math_1pct_seed0",
   "config_hash": "5bf2c80fb7bc49a0e3931f2ac5076b4d6048d9dccac27f8b7bf973617e70cdb9",
   "config_path": "evals/math/qwen2.5-0.5b/math_1pct_seed0/config.json",
+  "eval_results_path": "evals/math/qwen2.5-0.5b/math_1pct_seed0/5bf2c80fb7bc49a0e3931f2ac5076b4d6048d9dccac27f8b7bf973617e70cdb9/eval_results.jsonl",
   "base_model": "Qwen/Qwen2.5-0.5B",
   "mode": "contaminated",
   "epochs": 1,
   "n_params": 494032768,
   "proxy_dataset": "openwebtext/subset_20M_seed0.jsonl",
   "train_data_manifest": "training_pools/math_1pct_seed0_owt20M_K100_shuffle0.jsonl",
+  "wandb_run_url": "https://wandb.ai/nlp_and_interpretability/stride-applications-math/runs/uh4mzy1o",
+  "git_commit": "ea421a9",
+  "timestamp": "2026-04-25T17:53:03.207821+00:00",
   "benchmark": "math",
   "rate": 0.01,
   "seed": 0,