Kowsher
/

bangla-bert

Bert base Bangla

Bangla Base Bert

Bangla Bert language model

Model card Files Files and versions

Kowsher commited on Jul 5, 2021

Commit

b02525d

·

1 Parent(s): b13800c

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -7,7 +7,6 @@ tags:
 - Bangla Base Bert
 - Bangla Bert language model
 - Bangla Bert
-license: MIT
 datasets:
 - BanglaLM dataset
 ---
@@ -16,10 +15,11 @@ Here we published a pretrained Bangla bert language model as **bert-base-bangla*
 Here we described [bert-base-bangla](https://github.com/Kowsher/bert-base-bangla) which is a pretrained Bangla language model based on mask language modeling described in [BERT](https://arxiv.org/abs/1810.04805) and the GitHub  [repository](https://github.com/google-research/bert)
 ##  Corpus Details
 We trained the Bangla bert language model using BanglaLM dataset from kaggle [BanglaLM](https://www.kaggle.com/gakowsher/bangla-language-model-dataset). There is 3 version of dataset which is almost 40GB.
-After downloading the dataset, we went on the way of mask LM, described here [BERT](https://arxiv.org/abs/1810.04805)
-```
 **Bangla Base BERT Tokenizer**
 ```py
 from transformers import AutoTokenizer, AutoModel
 bnbert_tokenizer = AutoTokenizer.from_pretrained("Kowsher/bert-base-test")

 - Bangla Base Bert
 - Bangla Bert language model
 - Bangla Bert
 datasets:
 - BanglaLM dataset
 ---
 Here we described [bert-base-bangla](https://github.com/Kowsher/bert-base-bangla) which is a pretrained Bangla language model based on mask language modeling described in [BERT](https://arxiv.org/abs/1810.04805) and the GitHub  [repository](https://github.com/google-research/bert)
 ##  Corpus Details
 We trained the Bangla bert language model using BanglaLM dataset from kaggle [BanglaLM](https://www.kaggle.com/gakowsher/bangla-language-model-dataset). There is 3 version of dataset which is almost 40GB.
+After downloading the dataset, we went on the way to mask LM.
 **Bangla Base BERT Tokenizer**
 ```py
 from transformers import AutoTokenizer, AutoModel
 bnbert_tokenizer = AutoTokenizer.from_pretrained("Kowsher/bert-base-test")