| vocab_json = { | |
| "vocab_size": 10000, # Example vocab size | |
| "special_tokens": { | |
| "pad_token": "[PAD]", | |
| "unk_token": "[UNK]", | |
| "cls_token": "[CLS]", | |
| "sep_token": "[SEP]", | |
| "mask_token": "[MASK]", | |
| } | |
| } |
| vocab_json = { | |
| "vocab_size": 10000, # Example vocab size | |
| "special_tokens": { | |
| "pad_token": "[PAD]", | |
| "unk_token": "[UNK]", | |
| "cls_token": "[CLS]", | |
| "sep_token": "[SEP]", | |
| "mask_token": "[MASK]", | |
| } | |
| } |