MagedSaeed
/

APCD-Plus-meter-classification-model

Text Classification

model_hub_mixin

pytorch_model_hub_mixin

Model card Files Files and versions

MagedSaeed commited on Mar 17, 2025

Commit

9946b07

·

verified ·

1 Parent(s): 8d0ce5f

Upload tokenizer

Files changed (1) hide show

tokenizer_script.py +7 -5

tokenizer_script.py CHANGED Viewed

@@ -113,14 +113,16 @@ class CharacterTokenizer(PreTrainedTokenizer):
     @classmethod
     def from_json(cls, vocab_file, **kwargs):
-        with open(vocab_file, 'r', encoding='utf-8') as f:
-            vocab = json.load(f)
-        return cls(vocab=vocab, **kwargs)
     @classmethod
     def from_vocab(cls, vocab, **kwargs):
-        return cls(vocab=vocab, **kwargs)
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, *inputs, **kwargs):

     @classmethod
     def from_json(cls, vocab_file, **kwargs):
+      print('vocab file is:',vocab_file)
+      with open(vocab_file, 'r', encoding='utf-8') as f:
+          vocab = json.load(f)
+      return cls(vocab=vocab, **kwargs)
     @classmethod
     def from_vocab(cls, vocab, **kwargs):
+      print('vocab are:',vocab)
+      return cls(vocab=vocab, **kwargs)
     @classmethod
     def from_pretrained(cls, pretrained_model_name_or_path, *inputs, **kwargs):