karthyick
/

tinystories-24.5m-article-generation

Text Generation

small-language-model

children-stories

article-generation

Eval Results (legacy)

Model card Files Files and versions

karthyick commited on Oct 26, 2025

Commit

cfcc16d

·

verified ·

1 Parent(s): 5efea4f

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ A small language model (24.5M parameters) trained on the TinyStories dataset tha
 | **Grammar Score** | 8+/10 | **8.8-10/10** (with post-processing) | ✅ Exceeded |
 | **Perplexity** | <20 | **15.7** | ✅ Excellent |
 | **Articles per Story** | ~10 | **9 average** | ✅ Optimal |
-| **Training Time** | <48h | **~35 hours** (RTX 5090) | ✅ Met |
 **Overall Grade:** A (95/100) - Production Ready
@@ -84,7 +84,7 @@ python train_custom_tokenizer.py \
   --max_samples 100000
 ```
-### 2. Train Model (30-40 hours on RTX 5090)
 ```bash
 # Clean old cache
 rm -rf ./data/cache/*

 | **Grammar Score** | 8+/10 | **8.8-10/10** (with post-processing) | ✅ Exceeded |
 | **Perplexity** | <20 | **15.7** | ✅ Excellent |
 | **Articles per Story** | ~10 | **9 average** | ✅ Optimal |
+| **Training Time** | <48h | **~6 hours** (RTX 5090) | ✅ Met |
 **Overall Grade:** A (95/100) - Production Ready
   --max_samples 100000
 ```
+### 2. Train Model (6 hours on RTX 5090)
 ```bash
 # Clean old cache
 rm -rf ./data/cache/*