Upload TypeBERTForSequenceClassification

Browse files

Files changed (3) hide show

config.json +28 -0
pytorch_model.bin +3 -0
type_bert_model.py +68 -0

config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "architectures": [
+    "TypeBERTForSequenceClassification"
+  ],
+  "auto_map": {
+    "AutoConfig": "type_bert_model.TypeBERTConfig",
+    "AutoModelForSequenceClassification": "type_bert_model.TypeBERTForSequenceClassification"
+  },
+  "id2label": {
+    "0": "agent",
+    "1": "event",
+    "2": "place",
+    "3": "item",
+    "4": "virtual",
+    "5": "concept"
+  },
+  "label2id": {
+    "agent": 0,
+    "concept": 5,
+    "event": 1,
+    "item": 3,
+    "place": 2,
+    "virtual": 4
+  },
+  "model_type": "type_bert",
+  "torch_dtype": "float32",
+  "transformers_version": "4.22.1"
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a51f16e0417694151ffbea00afe90058d9707f82d0d59d88ed9a64230088f2fd
+size 448627745

type_bert_model.py ADDED Viewed

	@@ -0,0 +1,68 @@

+from transformers import BertTokenizer, BertModel
+from transformers import PretrainedConfig, PreTrainedModel
+import torch
+import torch.nn as nn
+class TypeBERTConfig(PretrainedConfig):
+    model_type = "type_bert"
+    def __init__(self, **kwargs):
+        super().__init__(**kwargs)
+        self.id2label = {
+            0: "agent",
+            1: "event",
+            2: "place",
+            3: "item",
+            4: "virtual",
+            5: "concept"
+        }
+        self.label2id = {
+            "agent": 0,
+            "event": 1,
+            "place": 2,
+            "item": 3,
+            "virtual": 4,
+            "concept": 5
+        }
+class TypeBERTForSequenceClassification(PreTrainedModel):
+    config_class = TypeBERTConfig
+    def __init__(self, config):
+        super(TypeBERTForSequenceClassification, self).__init__(config)
+        self.bert = BertModel.from_pretrained("bert-base-uncased")
+        # for param in self.bert.base_model.parameters():
+        #     param.requires_grad = False
+        #
+        # self.bert.eval()
+        self.tanh = nn.Tanh()
+        self.dff = nn.Sequential(
+            nn.Linear(768, 2048),
+            nn.ReLU(),
+            nn.Dropout(0.1),
+            nn.Linear(2048, 512),
+            nn.ReLU(),
+            nn.Dropout(0.1),
+            nn.Linear(512, 64),
+            nn.ReLU(),
+            nn.Dropout(0.1),
+            nn.Linear(64, 6),
+            nn.LogSoftmax(dim=1)
+        )
+        self.eval()
+    def forward(self, **kwargs):
+        a = kwargs['attention_mask']
+        embs = self.bert(**kwargs)['last_hidden_state']
+        embs *= a.unsqueeze(2)
+        out = embs.sum(dim=1) / a.sum(dim=1, keepdims=True)
+        return {'logits': self.dff(self.tanh(out))}