daslab-testing
/

CloverLM

Text Generation

low-precision-training

Model card Files Files and versions

mansaripo commited on Mar 20

Commit

1cbe20e

·

verified ·

1 Parent(s): f2ef64c

Update modeling_cloverlm.py

Files changed (1) hide show

modeling_cloverlm.py +1 -3

modeling_cloverlm.py CHANGED Viewed

@@ -209,13 +209,11 @@ class CloverLMForCausalLM(PreTrainedModel, GenerationMixin):
     config_class = CloverLMConfig
     supports_gradient_checkpointing = False
     _no_split_modules = ["_Block"]
-    _tied_weights_keys = ["transformer.linear.weight"]
     _tp_plan = {}
     def __init__(self, config: CloverLMConfig):
         super().__init__(config)
-        self.all_tied_weights_keys = {k: "transformer.emb.weight"
-                                      for k in (self._tied_weights_keys or [])}
         self.transformer = _Transformer(
             vocab_size=config.vocab_size,
             num_blocks=config.num_blocks,

     config_class = CloverLMConfig
     supports_gradient_checkpointing = False
     _no_split_modules = ["_Block"]
+    _tied_weights_keys = {"transformer.linear.weight": "transformer.emb.weight"}
     _tp_plan = {}
     def __init__(self, config: CloverLMConfig):
         super().__init__(config)
         self.transformer = _Transformer(
             vocab_size=config.vocab_size,
             num_blocks=config.num_blocks,