Upload DisamBert

Files changed (3) hide show

DisamBert.py CHANGED Viewed

@@ -25,20 +25,26 @@ class LexicalExample:
 class PaddedBatch:
     input_ids: torch.Tensor
     attention_mask: torch.Tensor
 class DisamBert(PreTrainedModel):
     def __init__(self, config:PreTrainedConfig):
         super().__init__(config)
-        self.BaseModel = AutoModel.from_pretrained(config.name_or_path,device_map="auto")
-        self.tokenizer = AutoTokenizer.from_pretrained(config.name_or_path)
-        with self.BaseModel.device:
-            self.classifier_head = nn.UninitializedParameter()
-        self.__entities = None
     @classmethod
     def from_base(cls, base_id: ModelURI):
-        return cls(AutoConfig.from_pretrained(base_id))
     def init_classifier(self, entities: Generator[LexicalExample]) -> None:

 class PaddedBatch:
     input_ids: torch.Tensor
     attention_mask: torch.Tensor
 class DisamBert(PreTrainedModel):
     def __init__(self, config:PreTrainedConfig):
         super().__init__(config)
+        if config.init_basemodel:
+            self.BaseModel = AutoModel.from_pretrained(config.name_or_path,device_map="auto")
+            with self.BaseModel.device:
+                self.classifier_head = nn.UninitializedParameter()
+            self.__entities = None
+            config.init_basemodel = False
+        self.tokenizer = AutoTokenizer.from_pretrained(config.tokenizer_path)
     @classmethod
     def from_base(cls, base_id: ModelURI):
+        config = AutoConfig.from_pretrained(base_id)
+        config.init_basemodel = True
+        config.tokenizer_path = base_id
+        return cls(config)
     def init_classifier(self, entities: Generator[LexicalExample]) -> None:

config.json CHANGED Viewed

@@ -117684,6 +117684,7 @@
   "gradient_checkpointing": false,
   "hidden_activation": "gelu",
   "hidden_size": 768,
   "initializer_cutoff_factor": 2.0,
   "initializer_range": 0.02,
   "intermediate_size": 1152,
@@ -117738,6 +117739,7 @@
   "sparse_pred_ignore_index": -100,
   "sparse_prediction": false,
   "tie_word_embeddings": true,
   "transformers_version": "5.0.0",
   "vocab_size": 50368
 }

   "gradient_checkpointing": false,
   "hidden_activation": "gelu",
   "hidden_size": 768,
+  "init_basemodel": false,
   "initializer_cutoff_factor": 2.0,
   "initializer_range": 0.02,
   "intermediate_size": 1152,
   "sparse_pred_ignore_index": -100,
   "sparse_prediction": false,
   "tie_word_embeddings": true,
+  "tokenizer_path": "answerdotai/ModernBERT-base",
   "transformers_version": "5.0.0",
   "vocab_size": 50368
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d2a927c475b82fe97cb22c4f9e8367a186e66d17a7716fd6fd231d190684f5d
 size 957523088

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb308140e16c5e25eadcd0b9b5a5b5aa2fd8a1e6ef2cdb12368f758087afff93
 size 957523088