Athspi LLM

Model Type: Transformer-based language model
Layers: 4
Embedding Dim: 384
Heads: 6
Sequence Length: 128 tokens
Parameters: ~28M

🧠 A small but capable language model for creative story generation, trained on the TinyStories dataset.

Model Details

pip install torch transformers sentencepiece

Safetensors

Model size

45.7M params

Tensor type

F32