Spaces:

tom-doerr
/

logo_generator

Runtime error

App Files Files Community

boris commited on Oct 8, 2021

Commit

708a42c

1 Parent(s): 272552a

fix(seq2seq): memory issue

Browse files

Files changed (1) hide show

dev/seq2seq/run_seq2seq_flax.py +2 -18

dev/seq2seq/run_seq2seq_flax.py CHANGED Viewed

@@ -100,12 +100,6 @@ class ModelArguments:
             "help": "Pretrained config name or path if not the same as model_name"
         },
     )
-    tokenizer_name: Optional[str] = field(
-        default=None,
-        metadata={
-            "help": "Pretrained tokenizer name or path if not the same as model_name"
-        },
-    )
     cache_dir: Optional[str] = field(
         default=None,
         metadata={
@@ -539,11 +533,6 @@ def main():
             )
     else:
-        base_model = FlaxAutoModelForSeq2SeqLM.from_pretrained(
-            model_args.model_name_or_path,
-            seed=training_args.seed,
-            dtype=getattr(jnp, model_args.dtype),
-        )
         # Set up our new model config
         config = BartConfig.from_pretrained(model_args.model_name_or_path)
         config.tie_word_embeddings = False
@@ -568,11 +557,6 @@ def main():
             config, seed=training_args.seed, dtype=getattr(jnp, model_args.dtype)
         )
-        # Use pre-trained weights for encoder
-        model.params["model"]["encoder"] = base_model.params["model"]["encoder"]
-        model.params["model"]["shared"] = base_model.params["model"]["shared"]
-        del base_model
     # Load tokenizer if it has not been set
     if tokenizer is None:
         tokenizer = AutoTokenizer.from_pretrained(
@@ -960,12 +944,12 @@ def main():
                 artifact.add_file(
                     str(Path(training_args.output_dir) / "training_state.json")
                 )
-                wandb.run.log_artifact(artifact)
                 # save some space
                 c = wandb.wandb_sdk.wandb_artifacts.get_artifacts_cache()
                 c.cleanup(wandb.util.from_human_size("5GB"))
             # save to the hub
             if training_args.push_to_hub:
                 model.save_pretrained(

             "help": "Pretrained config name or path if not the same as model_name"
         },
     )
     cache_dir: Optional[str] = field(
         default=None,
         metadata={
             )
     else:
         # Set up our new model config
         config = BartConfig.from_pretrained(model_args.model_name_or_path)
         config.tie_word_embeddings = False
             config, seed=training_args.seed, dtype=getattr(jnp, model_args.dtype)
         )
     # Load tokenizer if it has not been set
     if tokenizer is None:
         tokenizer = AutoTokenizer.from_pretrained(
                 artifact.add_file(
                     str(Path(training_args.output_dir) / "training_state.json")
                 )
                 # save some space
                 c = wandb.wandb_sdk.wandb_artifacts.get_artifacts_cache()
                 c.cleanup(wandb.util.from_human_size("5GB"))
+                wandb.run.log_artifact(artifact)
             # save to the hub
             if training_args.push_to_hub:
                 model.save_pretrained(