mims-harvard
/

MedTok

Model card Files Files and versions

Blair1213 commited on Jun 28, 2025

Commit

fbae8fe

·

verified ·

1 Parent(s): 0e38f41

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -11,11 +11,11 @@ MEDTOK is a multimodal tokenizer of medical codes that combines text description
 ## How to use MedTok?
 ```bash
 from transformers import AutoTokenizer
-tokenizer = AutoTokenizer.from_pretrained("mims-harvard/MedTok")
-tokens = tokenizer.tokenize("E11.9")
-ids = tokenizer.encode("E11.9")
 embed = tokenizer.embed("E11.9")
 ```
 If you want to use the tokenized embedding for each medical code, please download it from [mims-harvard/MedTok](https://huggingface.co/mims-harvard/MedTok) or [code2embeddings.json.zip](https://doi.org/10.7910/DVN/7XNT3M) directly. And the downloaded embedding file could be put into 'MedTok/embedding.npy' to run EHR or QA tasks based on MedTok.

 ## How to use MedTok?
 ```bash
 from transformers import AutoTokenizer
+tokenizer = AutoTokenizer.from_pretrained("mims-harvard/MedTok", trust_remote_code=True)
+tokens = tokenizer("E11.9")
 embed = tokenizer.embed("E11.9")
 ```
+- embed means the quantized embedding for this input medical code.
 If you want to use the tokenized embedding for each medical code, please download it from [mims-harvard/MedTok](https://huggingface.co/mims-harvard/MedTok) or [code2embeddings.json.zip](https://doi.org/10.7910/DVN/7XNT3M) directly. And the downloaded embedding file could be put into 'MedTok/embedding.npy' to run EHR or QA tasks based on MedTok.