Pin upstream transformer model revision in config.

Files changed (3) hide show

config.json CHANGED Viewed

@@ -8,6 +8,7 @@
   },
   "embedding_size": 512,
   "k_bucket_size": 1024,
   "model_type": "LUAR",
   "q_bucket_size": 512,
   "torch_dtype": "float32",

   },
   "embedding_size": 512,
   "k_bucket_size": 1024,
+  "upstream_transformer_revision": "48bffbbd27bf028ecdd0cd55abb51236ec12ef1b",
   "model_type": "LUAR",
   "q_bucket_size": 512,
   "torch_dtype": "float32",

config.py CHANGED Viewed

@@ -9,10 +9,12 @@ class LUARConfig(PretrainedConfig):
         use_memory_efficient_attention=False,
         q_bucket_size=512,
         k_bucket_size=1024,
         **kwargs,
     ):
         self.embedding_size = embedding_size
         self.use_memory_efficient_attention = use_memory_efficient_attention
         self.q_bucket_size = q_bucket_size
         self.k_bucket_size = k_bucket_size
-        super().__init__(**kwargs)

         use_memory_efficient_attention=False,
         q_bucket_size=512,
         k_bucket_size=1024,
+        upstream_transformer_revision=None,
         **kwargs,
     ):
         self.embedding_size = embedding_size
         self.use_memory_efficient_attention = use_memory_efficient_attention
         self.q_bucket_size = q_bucket_size
         self.k_bucket_size = k_bucket_size
+        self.upstream_transformer_revision = upstream_transformer_revision
+        super().__init__(**kwargs)

model.py CHANGED Viewed

@@ -139,7 +139,7 @@ class LUAR(PreTrainedModel):
     def __init__(self, config):
         super().__init__(config)
-        self.create_transformer()
         self.attn_fn = SelfAttention(
             config.use_memory_efficient_attention,
             config.q_bucket_size,
@@ -147,10 +147,11 @@ class LUAR(PreTrainedModel):
         )
         self.linear = nn.Linear(self.hidden_size, config.embedding_size)
-    def create_transformer(self):
         """Creates the Transformer backbone.
         """
-        self.transformer = AutoModel.from_pretrained("sentence-transformers/paraphrase-distilroberta-base-v1")
         self.hidden_size = self.transformer.config.hidden_size
         self.num_attention_heads = self.transformer.config.num_attention_heads
         self.dim_head = self.hidden_size // self.num_attention_heads

     def __init__(self, config):
         super().__init__(config)
+        self.create_transformer(revision=config.upstream_transformer_revision)
         self.attn_fn = SelfAttention(
             config.use_memory_efficient_attention,
             config.q_bucket_size,
         )
         self.linear = nn.Linear(self.hidden_size, config.embedding_size)
+    def create_transformer(self, revision=None):
         """Creates the Transformer backbone.
         """
+        kwargs = {"revision": revision} if revision else {}
+        self.transformer = AutoModel.from_pretrained("sentence-transformers/paraphrase-distilroberta-base-v1", **kwargs)
         self.hidden_size = self.transformer.config.hidden_size
         self.num_attention_heads = self.transformer.config.num_attention_heads
         self.dim_head = self.hidden_size // self.num_attention_heads