Upload folder using huggingface_hub

Browse files

Files changed (3) hide show

config.json +5 -2
model.safetensors +1 -1
modeling_simcse.py +48 -0

config.json CHANGED Viewed

@@ -23,5 +23,8 @@
   "transformers_version": "4.51.3",
   "type_vocab_size": 2,
   "use_cache": true,
-  "vocab_size": 32768
-}

   "transformers_version": "4.51.3",
   "type_vocab_size": 2,
   "use_cache": true,
+  "vocab_size": 32768,
+  "auto_map": {
+    "AutoModel": "modeling_simcse.SimCSEInferenceModel"
+  }
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56fa743a6730f3ae52e52f46365c5ef7f6433974240b5f0df3761378b7cafca7
 size 894432952

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc70afc6def7daeb474328a741d0ff0139f7c27291cf7c795c5c401c1f4c5ce4
 size 894432952

modeling_simcse.py ADDED Viewed

	@@ -0,0 +1,48 @@

+from __future__ import annotations
+from transformers import (
+    BertModel,
+    BertConfig,
+    PreTrainedModel,
+)
+from transformers.tokenization_utils_base import BatchEncoding
+import torch, torch.nn as nn, torch.nn.functional as F
+class SimCSEInferenceModel(PreTrainedModel):
+    config_class = BertConfig          # 推論時は BERT Config と合わせる
+    def __init__(self, config):
+        super().__init__(config)
+        # 追加ダウンロードを避けるため from_config で空モデルを組み立てる
+        base_cfg = BertConfig(**config.to_dict())
+        self.encoder_input  = BertModel(base_cfg)
+        self.encoder_output = BertModel(base_cfg)
+        hidden = self.encoder_input.config.hidden_size
+        self.dense_input  = nn.Linear(hidden, hidden)
+        self.dense_output = nn.Linear(hidden, hidden)
+        self.activation   = nn.Tanh()
+        self.temperature  = getattr(config, "simcse_temperature", 0.05)
+    @torch.no_grad()
+    def encode_input(self, tok: BatchEncoding) -> torch.Tensor:
+        h = self.encoder_input(**tok).last_hidden_state[:, 0]
+        return self.activation(self.dense_input(h))
+    @torch.no_grad()
+    def encode_output(self, tok: BatchEncoding) -> torch.Tensor:
+        h = self.encoder_output(**tok).last_hidden_state[:, 0]
+        return self.activation(self.dense_output(h))
+    def forward(
+        self,
+        tokenized_texts_1: BatchEncoding,
+        tokenized_texts_2: BatchEncoding,
+        labels: torch.Tensor,
+        **_
+    ):
+        device = next(self.parameters()).device
+        z1 = F.normalize(self.encode_input(tokenized_texts_1.to(device)), dim=-1)
+        z2 = F.normalize(self.encode_output(tokenized_texts_2.to(device)), dim=-1)
+        sim = torch.matmul(z1, z2.T)
+        loss = F.cross_entropy(sim / self.temperature, labels.to(device))
+        return {"loss": loss, "logits": sim}