Mir-2002
/

codet5p-google-style-docstrings

Model card Files Files and versions

Mir-2002 commited on Jun 26, 2025

Commit

aa3ead3

·

verified ·

1 Parent(s): 4dd2328

Update README.md

Files changed (1) hide show

README.md +12 -0

README.md CHANGED Viewed

@@ -115,6 +115,18 @@ tokenizer.save_pretrained(model_path)
 model.save_pretrained(model_path)
 ```
 # Hyperparameters
 MAX_SOURCE_LENGTH = 256 <br>

 model.save_pretrained(model_path)
 ```
+I then verified the token was added using this script:
+```python
+print("Token ID for <tdec>:", tokenizer.convert_tokens_to_ids("<tdec>"))
+print("Tokenized form of '<tdec>':", tokenizer.tokenize("<tdec>"))
+# Token ID for <tdec>: 32103
+# Tokenized form of '<tdec>': ['<tdec>']
+```
+These scripts were run before fine tuning the model.
 # Hyperparameters
 MAX_SOURCE_LENGTH = 256 <br>