crumb
/

768d-init

Text Generation

Model card Files Files and versions

crumb commited on Nov 25, 2023

Commit

07f04b1

·

1 Parent(s): 838f488

Update README.md

Files changed (1) hide show

README.md +8 -1

README.md CHANGED Viewed

	@@ -1 +1,8 @@
1	- `31,870,464` non-embedding params, `38,598,913` embedding params, `70,469,377` total

+`31,870,464` non-embedding params, `38,598,913` embedding params, `70,469,377` total.
+```
+"n_embd": 768
+"n_head": 6
+"n_inner": 1920
+"n_layer": 6
+"n_positions": 4096
+```