jacobcd52
/

features_over_time

jacobcd52 commited on Feb 11, 2025

Commit

ff79fea

verified ·

1 Parent(s): ae4578d

Upload trainer_0/config.json with huggingface_hub

Files changed (1) hide show

trainer_0/config.json CHANGED Viewed

@@ -2,8 +2,8 @@
     "trainer": {
         "trainer_class": "TopKTrainer",
         "dict_class": "AutoEncoderTopK",
-        "lr": 0.0002,
-        "steps": 12,
         "auxk_alpha": 0.03125,
         "warmup_steps": 0,
         "decay_start": null,
@@ -11,7 +11,7 @@
         "threshold_start_step": 1000,
         "seed": null,
         "activation_dim": 6144,
-        "dict_size": 16384,
         "k": 128,
         "device": "cuda:0",
         "layer": 4,
@@ -23,9 +23,9 @@
         "n_models": 12,
         "d_submodule": 512,
         "io": "out",
-        "n_ctxs": 512,
         "ctx_len": 128,
-        "refresh_batch_size": 256,
         "out_batch_size": 8192,
         "device": "cuda:0",
         "rescale_acts": true

     "trainer": {
         "trainer_class": "TopKTrainer",
         "dict_class": "AutoEncoderTopK",
+        "lr": 0.000282842712474619,
+        "steps": 61035,
         "auxk_alpha": 0.03125,
         "warmup_steps": 0,
         "decay_start": null,
         "threshold_start_step": 1000,
         "seed": null,
         "activation_dim": 6144,
+        "dict_size": 8192,
         "k": 128,
         "device": "cuda:0",
         "layer": 4,
         "n_models": 12,
         "d_submodule": 512,
         "io": "out",
+        "n_ctxs": 1024,
         "ctx_len": 128,
+        "refresh_batch_size": 512,
         "out_batch_size": 8192,
         "device": "cuda:0",
         "rescale_acts": true