TopAI-1
/

MCGPT-1

+from transformers import PretrainedConfig
+class MCGPTConfig(PretrainedConfig):
+    model_type = "mcgpt"
+    def __init__(
+        self,
+        vocab_size=33152,
+        hidden_size=256,
+        num_layers=4,
+        num_experts=4,
+        nhead=8,
+        max_position_embeddings=512,
+        **kwargs
+    ):
+        super().__init__(**kwargs)
+        self.vocab_size = vocab_size
+        self.hidden_size = hidden_size
+        self.num_layers = num_layers
+        self.num_hidden_layers = num_layers
+        self.num_experts = num_experts
+        self.nhead = nhead
+        self.max_position_embeddings = max_position_embeddings