mims-harvard
/

MedTok

Model card Files Files and versions

Blair1213 commited on Jun 28, 2025

Commit

c742bef

·

verified ·

1 Parent(s): 4268d0d

Update tokenizer.py

Files changed (1) hide show

tokenizer.py +3 -0

tokenizer.py CHANGED Viewed

@@ -91,6 +91,9 @@ class MedTok(PreTrainedTokenizer):
             "vocab_file": "vocab.json",
             "code2tokens_file": "code2tokens.json",
             "code2embedding_file": "code2embeddings.json",
         }
         with open(os.path.join(save_directory, "tokenizer_config.json"), "w") as f:
             json.dump(tokenizer_config, f, indent=2)

             "vocab_file": "vocab.json",
             "code2tokens_file": "code2tokens.json",
             "code2embedding_file": "code2embeddings.json",
+            "auto_map": {
+                "AutoTokenizer": "tokenizer.MedTok"
+            }
         }
         with open(os.path.join(save_directory, "tokenizer_config.json"), "w") as f:
             json.dump(tokenizer_config, f, indent=2)