Bingsu
/

ko_BBPE_tokenizer_roberta2

Model card Files Files and versions

Bingsu commited on Sep 3, 2022

Commit

efdcfc6

·

1 Parent(s): 6e4350a

Create README.md

Files changed (1) hide show

README.md +23 -0

README.md ADDED Viewed

	@@ -0,0 +1,23 @@

+---
+language:
+  - ko
+tags:
+  - roberta
+  - tokenizer only
+license:
+  - mit
+---
+## 라이브러리 버전
+- transformers: 4.21.2
+- datasets: 2.4.0
+- tokenizers: 0.12.1
+[Bingsu/ko_BBPE_tokenizer_roberta](https://huggingface.co/Bingsu/ko_BBPE_tokenizer_roberta)와 같은 방법으로 훈련한 토크나이저.
+다만 `unicode_normalizer="nfkc"`를 뺐습니다.
+```python
+tokenizer = ByteLevelBPETokenizer(trim_offsets=True)
+```