Upload MRIBrainSequenceBERT

Browse files

Files changed (4) hide show

config.json +1 -1
configuration.py +1 -1
model.safetensors +3 -0
modeling.py +47 -29

config.json CHANGED Viewed

@@ -10,6 +10,6 @@
   "dtype": "float32",
   "max_len": 512,
   "model_type": "mri_brain_sequence_bert",
-  "num_classes": 16,
   "transformers_version": "4.57.3"
 }

   "dtype": "float32",
   "max_len": 512,
   "model_type": "mri_brain_sequence_bert",
+  "num_classes": 17,
   "transformers_version": "4.57.3"
 }

configuration.py CHANGED Viewed

@@ -4,7 +4,7 @@ from transformers import PretrainedConfig
 class MRIBrainSequenceBERTConfig(PretrainedConfig):
     model_type = "mri_brain_sequence_bert"
-    def __init__(self, max_len=512, dropout=0.2, num_classes=16, **kwargs):
         self.max_len = max_len
         self.dropout = dropout
         self.num_classes = num_classes

 class MRIBrainSequenceBERTConfig(PretrainedConfig):
     model_type = "mri_brain_sequence_bert"
+    def __init__(self, max_len=512, dropout=0.2, num_classes=17, **kwargs):
         self.max_len = max_len
         self.dropout = dropout
         self.num_classes = num_classes

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba42fffeeb4437d9883787fdd868f19594989f19771a95d5761c53e95db48ea9
+size 1196973888

modeling.py CHANGED Viewed

@@ -12,18 +12,34 @@ from transformers import (
 from .configuration import MRIBrainSequenceBERTConfig
 class MRIBrainSequenceBERT(PreTrainedModel):
     config_class = MRIBrainSequenceBERTConfig
     def __init__(self, config):
         super().__init__(config)
         self.model_id = "answerdotai/ModernBERT-base"
-        self.llm = AutoModelForSequenceClassification.from_pretrained(self.model_id)
-        self.dim_feats = self.llm.classifier.in_features
-        self.dropout = nn.Dropout(p=config.dropout)
-        self.classifier = nn.Linear(self.dim_feats, config.num_classes)
-        self.llm.dropout = nn.Identity()
-        self.llm.classifier = nn.Identity()
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_id)
         self.max_len = config.max_len
@@ -33,7 +49,7 @@ class MRIBrainSequenceBERT(PreTrainedModel):
             "ImageType",
             "Manufacturer",
             "ManufacturerModelName",
-            # "ContrastBolusAgent",
             "ScanningSequence",
             "SequenceVariant",
             "ScanOptions",
@@ -54,8 +70,8 @@ class MRIBrainSequenceBERT(PreTrainedModel):
             "PercentSampling",
             "PercentPhaseFieldOfView",
             "PixelBandwidth",
-            # "ContrastBolusVolume",
-            # "ContrastBolusTotalDose",
             "AcquisitionMatrix",
             "InPlanePhaseEncodingDirection",
             "FlipAngle",
@@ -72,22 +88,23 @@ class MRIBrainSequenceBERT(PreTrainedModel):
         ]
         self.label2index = {
-            "t1": 0,  # T1 precontrast
-            "t1c": 1,  # T1 postcontrast
-            "t2": 2,  # T2
-            "flair": 3,  # T2-FLAIR
-            "dwi": 4,  # DWI trace
-            "adc": 5,  # ADC map
-            "dti": 6,  # DTI
-            "swi": 7,  # SWI
-            "swi_mip": 8,  # SWI MinIP
-            "phase": 9,  # SWI phase images
-            "mag": 10,  # SWI mag images
-            "gre": 11,  # T2* GRE
-            "perf": 12,  # Perfusion-related images
-            "pd": 13,  # Proton density
-            "loc": 14,  # Localizers
-            "other": 15,  # Other, NOS
         }
         self.index2label = {v: k for k, v in self.label2index.items()}
@@ -106,10 +123,11 @@ class MRIBrainSequenceBERT(PreTrainedModel):
         for k, v in x.items():
             x[k] = v.to(device)
-        features = self.llm(**x)["logits"]
-        logits = self.classifier(self.dropout(features))
-        if apply_softmax:
-            logits = torch.softmax(logits, dim=1)
         return logits
     def create_string_from_dicom(

 from .configuration import MRIBrainSequenceBERTConfig
+class SingleModel(nn.Module):
+    def __init__(self, config, model_id: str):
+        super().__init__()
+        self.llm = AutoModelForSequenceClassification.from_pretrained(model_id)
+        self.dim_feats = self.llm.classifier.in_features
+        self.dropout = nn.Dropout(p=config.dropout)
+        self.classifier = nn.Linear(self.dim_feats, config.num_classes)
+        self.llm.dropout = nn.Identity()
+        self.llm.classifier = nn.Identity()
+    def forward(self, x, apply_softmax: bool = True):
+        features = self.llm(**x)["logits"]
+        logits = self.classifier(self.dropout(features))
+        if apply_softmax:
+            logits = torch.softmax(logits, dim=1)
+        return logits
 class MRIBrainSequenceBERT(PreTrainedModel):
     config_class = MRIBrainSequenceBERTConfig
     def __init__(self, config):
         super().__init__(config)
         self.model_id = "answerdotai/ModernBERT-base"
+        self.m1 = SingleModel(config, self.model_id)
+        self.m2 = SingleModel(config, self.model_id)
+        self.ensemble = True
         self.tokenizer = AutoTokenizer.from_pretrained(self.model_id)
         self.max_len = config.max_len
             "ImageType",
             "Manufacturer",
             "ManufacturerModelName",
+            "ContrastBolusAgent",
             "ScanningSequence",
             "SequenceVariant",
             "ScanOptions",
             "PercentSampling",
             "PercentPhaseFieldOfView",
             "PixelBandwidth",
+            "ContrastBolusVolume",
+            "ContrastBolusTotalDose",
             "AcquisitionMatrix",
             "InPlanePhaseEncodingDirection",
             "FlipAngle",
         ]
         self.label2index = {
+            "t1": 0,
+            "t1c": 1,
+            "t2": 2,
+            "flair": 3,
+            "dwi": 4,
+            "adc": 5,
+            "eadc": 6,
+            "swi": 7,
+            "swi_mag": 8,
+            "swi_phase": 9,
+            "swi_minip": 10,
+            "t2_gre": 11,
+            "perfusion": 12,
+            "pd": 13,
+            "mra": 14,
+            "loc": 15,
+            "other": 16,
         }
         self.index2label = {v: k for k, v in self.label2index.items()}
         for k, v in x.items():
             x[k] = v.to(device)
+        logits = self.m1(x, apply_softmax=apply_softmax)
+        if self.ensemble:
+            logits += self.m2(x, apply_softmax=apply_softmax)
+            logits /= 2.0
         return logits
     def create_string_from_dicom(