Custom BPS SentenceTransformer
Model ini berbasis paraphrase-multilingual-MiniLM-L12-v2 dengan tambahan token khusus untuk konteks statistik Badan Pusat Statistik (BPS) Indonesia. Token baru mencakup istilah seperti PDRB, SP2020, SAKERNAS, dll.
Cara Penggunaan
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('yahyaabd/paraphrase-multilingual-MiniLM-L12-v2-bps-custom-tokenizer')
embeddings = model.encode(['PDRB meningkat di tahun 2023.', 'BPS merilis ST2023.'])
Kontak
Hubungi [yahyaabd] di Hugging Face untuk pertanyaan atau dukungan.