bioscan-ml
/

BarcodeBERT

Feature Extraction

token-classification

text-embeddings-inference

Model card Files Files and versions

nioushasadjadi commited on Nov 28, 2024

Commit

3888382

·

1 Parent(s): bcd9e56

Fixing tokenize return bug

Files changed (1) hide show

tokenizer.py +0 -2

tokenizer.py CHANGED Viewed

@@ -28,8 +28,6 @@ class KmerTokenizer(PreTrainedTokenizer):
     def tokenize(self, text, **kwargs):
         splits = [text[i:i + self.k] for i in range(0, len(text) - self.k + 1, self.stride)]
-        if kwargs.get('return_tensors') == 'pt':
-            return torch.tensor(splits)
         return splits
     def _encode(self, text, **kwargs):

     def tokenize(self, text, **kwargs):
         splits = [text[i:i + self.k] for i in range(0, len(text) - self.k + 1, self.stride)]
         return splits
     def _encode(self, text, **kwargs):