File size: 528 Bytes
05edf11 e3b51e1 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
---
language:
- ko
tags:
- bert
- tokenizer only
license:
- mit
---
## 라이브러리 버전
- transformers: 4.21.1
- datasets: 2.4.0
- tokenizers: 0.12.1
[Bingsu/ko_BBPE_tokenizer_roberta](https://huggingface.co/Bingsu/ko_BBPE_tokenizer_roberta)에서 post-processor를 BertProcessing로 변경하고 토크나이저 클래스를 `BertTokenizerFast`로 변경한 것입니다.
두 문장을 토크나이저에 입력했을 때, sep 토큰이 다르게 처리된다는 것을 제외하고 결과는 동일합니다. |