File size: 528 Bytes
05edf11
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e3b51e1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
---
language:
  - ko
tags:
  - bert
  - tokenizer only
license:
  - mit
---

## 라이브러리 버전

- transformers: 4.21.1
- datasets: 2.4.0
- tokenizers: 0.12.1

[Bingsu/ko_BBPE_tokenizer_roberta](https://huggingface.co/Bingsu/ko_BBPE_tokenizer_roberta)에서 post-processor를 BertProcessing로 변경하고 토크나이저 클래스를 `BertTokenizerFast`로 변경한 것입니다.

두 문장을 토크나이저에 입력했을 때, sep 토큰이 다르게 처리된다는 것을 제외하고 결과는 동일합니다.