Upload folder using huggingface_hub

Files changed (7) hide show

checkpoints/sft/v1/ckpt_000100.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:87d268e4184ab462d57b53b0f0541338b6848af4cfd9e7bcb3c2953091a5dcab
+size 52267199

checkpoints/sft/v1/ckpt_001000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b2120ba480c43bcf5e9b7befce9a69f423d908d7b6aa175d0ae1c41b820c41fa
+size 52267199

checkpoints/sft/v1/ckpt_002000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:058fc09f37114f24572b8423dab508cca906b34237862cb9b666fe1fc95bb826
+size 52267199

checkpoints/sft/v1/ckpt_003000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f78a32c45601977d781097a3f2c09321fdcb19bfef445fcec64a8dab12177fbb
+size 52267199

checkpoints/sft/v1/ckpt_004000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5d2467e53602915c50c8564afab546c560eaaa8c32379b141c451a036fbd989
+size 52267199

checkpoints/sft/v1/ckpt_005000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f02b848ae3e83cf66ba007329b554ccc0b2204b4766b9ab52a6fdd829fd4d12
+size 52267199

checkpoints/sft/v1/config.json ADDED Viewed

+{
+  "model": {
+    "vocab_size": 4096,
+    "n_embd": 256,
+    "n_head": 4,
+    "n_layer": 4,
+    "block_size": 256,
+    "dropout": 0.1
+  },
+  "finetune": {
+    "checkpoint": ".data/models/kn1ght-small/ckpt_200000.pt",
+    "output_dir": "/Users/ericallen/Development/_scratchpad/kn1ght/.data/models/kn1ght-sft",
+    "n_per_opening": 5,
+    "temperature": 0.7,
+    "top_k": 40,
+    "max_gen_tokens": 80,
+    "min_half_moves": 6,
+    "hf_dataset": "InterwebAlchemy/pgn-dataset-including-special-tokens",
+    "hf_mix_games": 10000,
+    "batch_size": 32,
+    "learning_rate": 0.0001,
+    "min_lr": 1e-05,
+    "max_iters": 5000,
+    "warmup_iters": 200,
+    "grad_clip": 1.0,
+    "weight_decay": 0.1,
+    "turn_number_weight": 0.15,
+    "openings_repeat": 20,
+    "eval_interval": 500,
+    "eval_iters": 50,
+    "log_interval": 50,
+    "save_interval": 1000,
+    "seed": 42
+  }
+}