VirtualInsight
/

Lumen

Model card Files Files and versions

VirtualInsight commited on Oct 11, 2025

Commit

21afe4a

·

verified ·

1 Parent(s): 1917715

Update config.json

Files changed (1) hide show

config.json +12 -9

config.json CHANGED Viewed

@@ -1,18 +1,21 @@
 {
     "vocab_size": 32000,
     "hidden_size": 768,
-    "n_heads": 12,
-    "n_kv_heads": 4,
-    "n_kv_groups": 3,
     "head_dim": 64,
-    "n_layers": 12,
     "attention_bias": false,
-    "intermediate_size": 3072,
     "mlp_bias": false,
-    "eps": 1e-5,
-    "dropout": 0.0,
     "max_position_embeddings": 2048,
     "pre_norm": true,
-    "tie_weights": true,
     "max_seq_len": 2048
-}

 {
+    "architectures": ["LumenModel"],
+    "model_type": "lumen",
     "vocab_size": 32000,
     "hidden_size": 768,
+    "num_attention_heads": 12,
+    "num_key_value_heads": 4,
+    "num_hidden_layers": 12,
+    "intermediate_size": 3072,
     "head_dim": 64,
+    "n_kv_groups": 3,
     "attention_bias": false,
     "mlp_bias": false,
+    "layer_norm_eps": 1e-5,
+    "hidden_dropout_prob": 0.0,
     "max_position_embeddings": 2048,
     "pre_norm": true,
+    "tie_word_embeddings": true,
+    "torch_dtype": "bfloat16",
     "max_seq_len": 2048
+}