| // tokenizer_config.json | |
| { | |
| "bos_token": "<|endoftext|>", | |
| "eos_token": "<|endoftext|>", | |
| "unk_token": "<|endoftext|>", | |
| "model_max_length": 1024, | |
| "padding_side": "left", | |
| "tokenizer_class": "GPT2Tokenizer" | |
| } |
| // tokenizer_config.json | |
| { | |
| "bos_token": "<|endoftext|>", | |
| "eos_token": "<|endoftext|>", | |
| "unk_token": "<|endoftext|>", | |
| "model_max_length": 1024, | |
| "padding_side": "left", | |
| "tokenizer_class": "GPT2Tokenizer" | |
| } |