itriedcoding
/

Sage-1B

+{
+  "vocab_size": 50000,
+  "hidden_size": 1536,
+  "num_hidden_layers": 30,
+  "num_attention_heads": 12,
+  "head_dim": 128,
+  "intermediate_size": 6144,
+  "max_position_embeddings": 128,
+  "model_type": "sage_1b",
+  "total_params": 1286155776,
+  "torch_dtype": "float32"
+}