Update README.md

by goryden - opened May 13, 2025

←

Owner May 13, 2025

from transformers import T5Tokenizer
text = "сайн уу"

mn_tokenizer = T5Tokenizer(vocab_file="mn_tokenizer.model")

tokens = mn_tokenizer.tokenize(text)
encoded = mn_tokenizer.encode(text)
decoded = mn_tokenizer.decode(encoded)

print("Original:", text)
print("Mongolian tokenizer tokens:", tokens)
print("Decoded :", decoded)

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

Cannot merge

This branch has merge conflicts in the following files:

· Sign up or log in to comment