Models
Datasets
Spaces
Buckets new
Docs
Enterprise
Pricing
- Website
- Community
- Solutions
Log In
Sign Up

romizone
/

bpe-tokenizer-id

Token Classification

bahasa-indonesia

text-processing

subword-tokenization

Model card Files Files and versions

Instructions to use romizone/bpe-tokenizer-id with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use romizone/bpe-tokenizer-id with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("token-classification", model="romizone/bpe-tokenizer-id")

# Load model directly
from transformers import AutoModel
model = AutoModel.from_pretrained("romizone/bpe-tokenizer-id", dtype="auto")

Notebooks
Google Colab
Kaggle

bpe-tokenizer-id

304 kB

Ctrl+K

Ctrl+K

1 contributor

History: 5 commits

romizone's picture

Upload BPE Tokenizer Bahasa Indonesia

5a45b76 verified 3 months ago

.gitattributes

1.52 kB
initial commit 3 months ago
README.md

12.8 kB
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
bpe_tokenizer.py

14.3 kB
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
merges.txt

38.8 kB
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
special_tokens_map.json

98 Bytes
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
tokenizer.json

163 kB
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
tokenizer_config.json

219 Bytes
Upload BPE Tokenizer Bahasa Indonesia 3 months ago
vocab.json

72.3 kB
Upload BPE Tokenizer Bahasa Indonesia 3 months ago