zai-org
/

chatglm2-6b

Model card Files Files and versions

katuni4ka commited on Nov 8, 2023

Commit

3418503

·

1 Parent(s): c2354b9

Update tokenization_chatglm.py

Files changed (1) hide show

tokenization_chatglm.py +3 -0

tokenization_chatglm.py CHANGED Viewed

@@ -70,6 +70,9 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
         super().__init__(padding_side=padding_side, clean_up_tokenization_spaces=clean_up_tokenization_spaces, **kwargs)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,

         self.vocab_file = vocab_file
         self.tokenizer = SPTokenizer(vocab_file)
+        kwargs.pop("eos_token")
+        kwargs.pop("pad_token")
+        kwargs.pop("unk_token")
         super().__init__(padding_side=padding_side, clean_up_tokenization_spaces=clean_up_tokenization_spaces, **kwargs)
         self.special_tokens = {
             "<bos>": self.tokenizer.bos_id,