Add base CPU-optimized SLM model

Browse files

Base 3.7M parameter CPU-optimized language model ready for fine-tuning

Files changed (5) hide show

.gitattributes +2 -35
README.md +90 -3
config.json +15 -0
pytorch_model.bin +3 -0
tokenizer.json +0 -0

.gitattributes CHANGED Viewed

@@ -1,35 +1,2 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text


1	+ *.bin filter=lfs diff=lfs merge=lfs -text
2	+ *.safetensors filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,90 @@
----
-license: unknown
----

+# Base Small Language Model (SLM)
+## 🚀 CPU-First Base Language Model
+This is the **base model** before fine-tuning - a blazing-fast, CPU-optimized Small Language Model foundation:
+### ⚡ Performance Highlights
+- **164 tokens/sec** on CPU (fast base performance)
+- **45.2MB model size** (base model)
+- **3.7M parameters** (tiny but powerful)
+- **General language understanding** (pre-fine-tuning)
+### 🎯 Training Speed
+- **28 minutes** for base training (4 epochs)
+- **Fast convergence** with efficient architecture
+- **Ready for fine-tuning** on any domain
+### 🔧 Technical Specs
+- **Architecture:** Transformer-lite with RMSNorm, SwiGLU, Rotary embeddings
+- **Optimization:** CPU-first with memory mapping and efficient batching
+- **Framework:** PyTorch (CPU optimized)
+- **Training:** Trained on conversational data
+### 📱 Deployment Ready
+- **CPU optimized:** No GPU required
+- **Fast startup:** Instant model loading
+- **Low memory:** Efficient memory usage
+- **Fine-tuning ready:** Perfect base for domain adaptation
+## Usage
+### Load and Use Base Model
+```python
+import torch
+import sys
+sys.path.append('src')
+from model import create_model_from_config
+from tokenizer import BPETokenizer
+# Load model
+checkpoint = torch.load("checkpoints/model_latest.pt", map_location='cpu')
+config = checkpoint['config']
+model = create_model_from_config(config)
+model.load_state_dict(checkpoint['model_state_dict'])
+# Load tokenizer
+tokenizer = BPETokenizer()
+tokenizer.load("data/tokenizer.json")
+# Generate
+prompt = "Hello, how are you?"
+input_ids = tokenizer.encode(prompt, add_special_tokens=True)
+input_ids = torch.tensor([input_ids], dtype=torch.long)
+model.eval()
+with torch.no_grad():
+    for _ in range(20):
+        logits = model(input_ids)[0, -1, :]
+        next_token = torch.argmax(logits, dim=-1).unsqueeze(0)
+        input_ids = torch.cat([input_ids, next_token.unsqueeze(0)], dim=1)
+response = tokenizer.decode(input_ids[0].tolist(), skip_special_tokens=True)
+print(response)
+```
+### Fine-tune on Your Data
+```python
+# Use this base model for fine-tuning
+python finetune_qa.py --base_model checkpoints/model_latest.pt --conversations your_data.json
+```
+## Model Details
+- **Base Model:** Trained on conversational data
+- **Architecture:** Transformer-lite with modern optimizations
+- **Size:** 45.2MB (base model)
+- **License:** MIT
+## Performance
+| Metric | Value |
+|--------|-------|
+| Speed | 164 tokens/sec |
+| Size | 45.2MB |
+| Parameters | 3.7M |
+| Training Time | 28 minutes |
+This base model provides an excellent foundation for fine-tuning on specific domains or tasks.

config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "model_type": "transformer_lite",
+  "architectures": [
+    "TransformerLite"
+  ],
+  "vocab_size": 12288,
+  "hidden_size": 128,
+  "num_hidden_layers": 2,
+  "num_attention_heads": 4,
+  "intermediate_size": 512,
+  "max_position_embeddings": 64,
+  "model_format": "base",
+  "framework": "pytorch",
+  "device": "cpu"
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05d26d5c2c64675cfcd3093a61f6568d33b15ba6432490ee6d2b6819a5b9359d
+size 45224313

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff