paulhindemith
/

fasttext-jp-embedding

Feature Extraction

Model card Files Files and versions

paulhindemith commited on Nov 13, 2022

Commit

8acc99c

·

1 Parent(s): 1680e48

commit files to HF hub

Files changed (1) hide show

fasttext_jp_tokenizer.py +4 -1

fasttext_jp_tokenizer.py CHANGED Viewed

@@ -100,7 +100,10 @@ class FastTextJpTokenizer(MeCabTokenizer):
         Returns:
             int: ID
         """
-        return self.stoi[token]
     def _convert_id_to_token(self, index: int) -> str:
         """IDから単語

         Returns:
             int: ID
         """
+        id = self.stoi.get(token)
+        if id is not None:
+            return id
+        return self.stoi[self.unk_token]
     def _convert_id_to_token(self, index: int) -> str:
         """IDから単語