drixo
/

realtime-tts

Model card Files Files and versions

drixo commited on Feb 20

Commit

f4d6261

·

verified ·

1 Parent(s): 430a758

Update tokenizer.py

Files changed (1) hide show

tokenizer.py +4 -10

tokenizer.py CHANGED Viewed

@@ -1,20 +1,14 @@
 import sentencepiece as spm
 class TTSTokenizer:
     def __init__(self, model_path):
         self.sp = spm.SentencePieceProcessor()
         self.sp.load(model_path)
     def encode(self, text):
-        return self.sp.encode(text)
-    def decode(self, ids):
-        return self.sp.decode(ids)
-        spm.SentencePieceTrainer.train(
-    input="all_text.txt",
-    model_prefix="tts_tokenizer",
-    vocab_size=8000,
-    model_type="unigram"
-)

 import sentencepiece as spm
 class TTSTokenizer:
     def __init__(self, model_path):
         self.sp = spm.SentencePieceProcessor()
         self.sp.load(model_path)
     def encode(self, text):
+        return self.sp.encode(text, out_type=int)
+    def decode(self, tokens):
+        return self.sp.decode(tokens)