tameto
/

kimetsu-style-gpt-tiny

Text Generation

next-token-prediction

text-generation-inference

Model card Files Files and versions

tameto commited on Sep 19, 2025

Commit

66ffc6f

·

verified ·

1 Parent(s): 021bbe6

Initial kimetsu-style tiny GPT

Files changed (3) hide show

config.json +2 -2
model.safetensors +2 -2
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -11,12 +11,12 @@
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
-  "n_ctx": 128,
   "n_embd": 256,
   "n_head": 4,
   "n_inner": null,
   "n_layer": 2,
-  "n_positions": 128,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,

   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
+  "n_ctx": 256,
   "n_embd": 256,
   "n_head": 4,
   "n_inner": null,
   "n_layer": 2,
+  "n_positions": 256,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:504d915f248c64adad7ad6677af48d648944d1d93c33fb4e44c650a1a5e3aed8
-size 39221936

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc0317349411b7f52ba711c4d5594f3d5177aa8b185e01346dab9a33fe4d0a57
+size 39353008

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:83477d2c8dfea6010fdbc937e2b76bfb8940d94a0bd43cdb4777bf525745985d
 size 5777

 version https://git-lfs.github.com/spec/v1
+oid sha256:1ea5e711c9c44476ebdae23ca1f2093187c4c2dcfafbe692f8237bb3fd506bf9
 size 5777