--- license: mit --- # Instagram Caption Classifier (Fine-tuned BERT) Model ini merupakan hasil fine-tuning BERT (`bert-base-uncased`) untuk klasifikasi caption Instagram. Model ini dilatih menggunakan data caption yang telah dilabeli, sehingga dapat digunakan untuk mengklasifikasikan jenis caption pada postingan Instagram. ## Dataset - Data: Caption Instagram berbahasa Indonesia, sudah dilabeli sesuai kategori relevan. - Format: CSV, kolom utama: `post_caption`, `label_1`. - Tersedia juga dataset komentar dan caption influencer Instagram yang sudah kami scrapping di Kaggle: [Kaggle Dataset - Instagram Influencer and Brand](https://www.kaggle.com/datasets/azrilfahmiardi/instagram-influencer-and-brand) ## Cara Penggunaan ```python from transformers import BertTokenizer, BertForSequenceClassification import torch model = BertForSequenceClassification.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert") tokenizer = BertTokenizer.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert") text = "Caption contoh di sini" inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True) outputs = model(**inputs) pred = torch.argmax(outputs.logits, dim=1) ``` ## Label Kategori Label yang digunakan dapat dilihat pada file `label_names.json` di repo ini. ## Lisensi Model ini hanya untuk keperluan riset dan non-komersial.