BharatAidotin
/

BharatAI_RS1

Text Generation

Model card Files Files and versions

RANITBAG commited on Sep 8, 2025

Commit

b128384

·

verified ·

1 Parent(s): 4ddc328

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ pip install torch transformers datasets sentencepiece evaluate accelerate zstand
 - **tokenizer.model** - Pre-generated tokenizer file.
 ## Tokenizer
-The tokenizer is based on SentencePiece and has been pre-generated. If you wish to train a new tokenizer, use:
 ```python
 import sentencepiece as spm
 spm.SentencePieceTrainer.train(input='data.txt', model_prefix='tokenizer', vocab_size=1000)

 - **tokenizer.model** - Pre-generated tokenizer file.
 ## Tokenizer
+The tokenizer is based on SentencePiece and has been updated. The old local tokenizer.model has been removed and replaced with a new tokenizer.model uploaded to the Hugging Face Hub. If you wish to train a new tokenizer, use:
 ```python
 import sentencepiece as spm
 spm.SentencePieceTrainer.train(input='data.txt', model_prefix='tokenizer', vocab_size=1000)