junnyu
/

ChineseBERT-base

Model card Files Files and versions

junnyu commited on Jul 12, 2021

Commit

7ef73ba

·

1 Parent(s): 7efc1de

Update README.md

Files changed (1) hide show

README.md +12 -18

README.md CHANGED Viewed

@@ -4,14 +4,11 @@ tags:
 - glycebert
 inference: False
 ---
-# GlyceBert_pytorch
-## https://github.com/JunnYu/GlyceBert_pytorch
-本项目主要自定义了tokenization_glycebert_fast.py文件中的GlyceBertTokenizerFast代码。从而可以从huggingface.co调用。
 ```python
 pretrained_tokenizer_name = "junnyu/ChineseBERT-base"
-tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 ```
 # Paper
@@ -20,32 +17,29 @@ tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 # Install
 ```bash
-pip install glycebert
 or
-pip install git+https://github.com/JunnYu/GlyceBert_pytorch.git
 ```
 # Usage
 ```python
 import torch
-from transformers import BertConfig as GlyceBertConfig
-from glycebert import GlyceBertForMaskedLM, GlyceBertTokenizerFast
-# 使用我这个里面的tokenizer config和model config
 pretrained_tokenizer_name = "junnyu/ChineseBERT-base"
 pretrained_model_name = "ShannonAI/ChineseBERT-base"
-tokenizer = GlyceBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
-config = GlyceBertConfig.from_pretrained(pretrained_tokenizer_name)
-chinese_bert = GlyceBertForMaskedLM.from_pretrained(
-    pretrained_model_name, config=config
-)
 text = "北京是[MASK]国的首都。"
 inputs = tokenizer(text, return_tensors="pt")
 print(inputs)
 maskpos = 4
 with torch.no_grad():
     o = chinese_bert(**inputs)
     value, index = o.logits.softmax(-1)[0, maskpos].topk(10)
@@ -63,4 +57,4 @@ print(outputs)
 ```
 # Reference
-https://github.com/ShannonAI/ChineseBert

 - glycebert
 inference: False
 ---
+# ChineseBert_pytorch
+本项目主要自定义了tokenization_chinesebert_fast.py文件中的ChineseBertTokenizerFast代码。从而可以从huggingface.co调用。
 ```python
 pretrained_tokenizer_name = "junnyu/ChineseBERT-base"
+tokenizer = ChineseBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
 ```
 # Paper
 # Install
 ```bash
+pip install chinesebert
 or
+pip install git+https://github.com/JunnYu/ChineseBert_pytorch.git
 ```
 # Usage
 ```python
 import torch
+from transformers import BertConfig as ChineseBertConfig
+from chinesebert import ChineseBertForMaskedLM, ChineseBertTokenizerFast
 pretrained_tokenizer_name = "junnyu/ChineseBERT-base"
 pretrained_model_name = "ShannonAI/ChineseBERT-base"
+tokenizer = ChineseBertTokenizerFast.from_pretrained(pretrained_tokenizer_name)
+config = ChineseBertConfig.from_pretrained(pretrained_tokenizer_name)
+chinese_bert = ChineseBertForMaskedLM.from_pretrained(pretrained_model_name, config=config)
 text = "北京是[MASK]国的首都。"
 inputs = tokenizer(text, return_tensors="pt")
 print(inputs)
 maskpos = 4
 with torch.no_grad():
     o = chinese_bert(**inputs)
     value, index = o.logits.softmax(-1)[0, maskpos].topk(10)
 ```
 # Reference
+https://github.com/ShannonAI/ChineseBert