|
|
--- |
|
|
license: mit |
|
|
--- |
|
|
# Instagram Caption Classifier (Fine-tuned BERT) |
|
|
|
|
|
Model ini merupakan hasil fine-tuning BERT (`bert-base-uncased`) untuk klasifikasi caption Instagram. Model ini dilatih menggunakan data caption yang telah dilabeli, sehingga dapat digunakan untuk mengklasifikasikan jenis caption pada postingan Instagram. |
|
|
|
|
|
## Dataset |
|
|
- Data: Caption Instagram berbahasa Indonesia, sudah dilabeli sesuai kategori relevan. |
|
|
- Format: CSV, kolom utama: `post_caption`, `label_1`. |
|
|
- Tersedia juga dataset komentar dan caption influencer Instagram yang sudah kami scrapping di Kaggle: [Kaggle Dataset - Instagram Influencer and Brand](https://www.kaggle.com/datasets/azrilfahmiardi/instagram-influencer-and-brand) |
|
|
|
|
|
## Cara Penggunaan |
|
|
|
|
|
```python |
|
|
from transformers import BertTokenizer, BertForSequenceClassification |
|
|
import torch |
|
|
|
|
|
model = BertForSequenceClassification.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert") |
|
|
tokenizer = BertTokenizer.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert") |
|
|
|
|
|
text = "Caption contoh di sini" |
|
|
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True) |
|
|
outputs = model(**inputs) |
|
|
pred = torch.argmax(outputs.logits, dim=1) |
|
|
``` |
|
|
|
|
|
## Label Kategori |
|
|
Label yang digunakan dapat dilihat pada file `label_names.json` di repo ini. |
|
|
|
|
|
## Lisensi |
|
|
Model ini hanya untuk keperluan riset dan non-komersial. |
|
|
|