DatarrX
/

myX-Tokenizer

@@ -87,9 +87,7 @@ print(f"Tokens: {tokens}")
 If you use this tokenizer in your research or project, please cite it as follows:
 ### APA 7th Edition
-```APA
 Khant Sint Heinn. (2026). *myX-Tokenizer: A Syllable-aware Bilingual Unigram Tokenizer for Burmese and English (Version 1.0)* [Computer software]. Hugging Face. https://huggingface.co/DatarrX/myX-Tokenizer
-```
 ### BibTeX
 ```BibTeX
@@ -133,7 +131,6 @@ We are committed to advancing the Burmese NLP ecosystem. For feedback or collabo
 ### အသုံးပြုထားသော Dataset (Training Data)
 ဤ Model ကို [kalixlouiis/myX-Corpus](https://huggingface.co/datasets/kalixlouiis/myX-Corpus) ကို အသုံးပြု၍ လေ့ကျင့်ထားခြင်း ဖြစ်ပါသည်။ ၎င်း Corpus ထဲမှ အရည်အသွေးမြင့် စာကြောင်းပေါင်း **၁.၅ သန်း (1.5 Million)** ကို Random Sample ယူ၍ Train ထားခြင်း ဖြစ်ပါသည်။
 ---
 ## ⚠️ သိထားရန် ကန့်သတ်ချက်များ (Limitations & Bias)
@@ -174,9 +171,7 @@ print(f"Pieces: {sp.encode_as_pieces(text)}")
 အကယ်၍ သင်သည် ဤ model ကို သင်၏ သုတေသနလုပ်ငန်းများတွင် အသုံးပြုခဲ့ပါက အောက်ပါအတိုင်း ကိုးကားပေးရန် မေတ္တာရပ်ခံအပ်ပါသည်။
 ### APA 7th Edition
-```APA
 Khant Sint Heinn. (2026). *myX-Tokenizer: A Syllable-aware Bilingual Unigram Tokenizer for Burmese and English (Version 1.0)* [Computer software]. Hugging Face. https://huggingface.co/DatarrX/myX-Tokenizer
-```
 ### BibTeX
 ```BibTeX

 If you use this tokenizer in your research or project, please cite it as follows:
 ### APA 7th Edition
 Khant Sint Heinn. (2026). *myX-Tokenizer: A Syllable-aware Bilingual Unigram Tokenizer for Burmese and English (Version 1.0)* [Computer software]. Hugging Face. https://huggingface.co/DatarrX/myX-Tokenizer
 ### BibTeX
 ```BibTeX
 ### အသုံးပြုထားသော Dataset (Training Data)
 ဤ Model ကို [kalixlouiis/myX-Corpus](https://huggingface.co/datasets/kalixlouiis/myX-Corpus) ကို အသုံးပြု၍ လေ့ကျင့်ထားခြင်း ဖြစ်ပါသည်။ ၎င်း Corpus ထဲမှ အရည်အသွေးမြင့် စာကြောင်းပေါင်း **၁.၅ သန်း (1.5 Million)** ကို Random Sample ယူ၍ Train ထားခြင်း ဖြစ်ပါသည်။
 ---
 ## ⚠️ သိထားရန် ကန့်သတ်ချက်များ (Limitations & Bias)
 အကယ်၍ သင်သည် ဤ model ကို သင်၏ သုတေသနလုပ်ငန်းများတွင် အသုံးပြုခဲ့ပါက အောက်ပါအတိုင်း ကိုးကားပေးရန် မေတ္တာရပ်ခံအပ်ပါသည်။
 ### APA 7th Edition
 Khant Sint Heinn. (2026). *myX-Tokenizer: A Syllable-aware Bilingual Unigram Tokenizer for Burmese and English (Version 1.0)* [Computer software]. Hugging Face. https://huggingface.co/DatarrX/myX-Tokenizer
 ### BibTeX
 ```BibTeX