Bingsu's picture
Update README.md
e3b51e1
metadata
language:
  - ko
tags:
  - bert
  - tokenizer only
license:
  - mit

라이브러리 버전

  • transformers: 4.21.1
  • datasets: 2.4.0
  • tokenizers: 0.12.1

Bingsu/ko_BBPE_tokenizer_roberta에서 post-processor를 BertProcessing로 변경하고 토크나이저 클래스를 BertTokenizerFast로 변경한 것입니다.

두 문장을 토크나이저에 입력했을 때, sep 토큰이 다르게 처리된다는 것을 제외하고 결과는 동일합니다.