LLM-course
/

gbl1357

Text Generation

chess_transformer

chess-challenge

Model card Files Files and versions

gbl1357 commited on Jan 16

Commit

d1440d4

·

verified ·

1 Parent(s): d2c88cf

Chess Challenge submission by gbl1357

Files changed (3) hide show

README.md +3 -3
config.json +3 -3
model.safetensors +2 -2

README.md CHANGED Viewed

@@ -14,13 +14,13 @@ Chess model submitted to the LLM Course Chess Challenge.
 ## Submission Info
 - **Submitted by**: [gbl1357](https://huggingface.co/gbl1357)
-- **Parameters**: 976,860
 - **Organization**: LLM-course
 ## Model Details
 - **Architecture**: Chess Transformer (GPT-style)
 - **Vocab size**: 73
-- **Embedding dim**: 108
-- **Layers**: 5
 - **Heads**: 4

 ## Submission Info
 - **Submitted by**: [gbl1357](https://huggingface.co/gbl1357)
+- **Parameters**: 950,872
 - **Organization**: LLM-course
 ## Model Details
 - **Architecture**: Chess Transformer (GPT-style)
 - **Vocab size**: 73
+- **Embedding dim**: 104
+- **Layers**: 7
 - **Heads**: 4

config.json CHANGED Viewed

@@ -9,10 +9,10 @@
   "layer_norm_epsilon": 1e-05,
   "model_type": "chess_transformer",
   "n_ctx": 256,
-  "n_embd": 108,
   "n_head": 4,
-  "n_inner": 432,
-  "n_layer": 5,
   "pad_token_id": 0,
   "tie_weights": true,
   "transformers_version": "4.57.5",

   "layer_norm_epsilon": 1e-05,
   "model_type": "chess_transformer",
   "n_ctx": 256,
+  "n_embd": 104,
   "n_head": 4,
+  "n_inner": 416,
+  "n_layer": 7,
   "pad_token_id": 0,
   "tie_weights": true,
   "transformers_version": "4.57.5",

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43cf255542febd20e78503c52775116b4f53e30946620d822d516be5b1fbf735
-size 3912008

 version https://git-lfs.github.com/spec/v1
+oid sha256:0ad5282db5804df9e7274693b000313b9288e26c581a3ac31c64c9a57cb195b4
+size 3809784