File size: 1,387 Bytes
947853b |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
---
license: mit
---
# Instagram Comments Classifier (Fine-tuned BERT)
Model ini merupakan hasil fine-tuning BERT (`bert-base-uncased`) untuk klasifikasi komentar Instagram. Model ini dilatih menggunakan data komentar yang telah dilabeli, sehingga dapat digunakan untuk mengklasifikasikan jenis komentar pada postingan Instagram.
## Dataset
- Data: Komentar Instagram berbahasa Indonesia, sudah dilabeli sesuai kategori relevan.
- Format: CSV, kolom utama: `comment`, `predicted_label`.
- Tersedia juga dataset komentar dan caption influencer Instagram yang sudah kami scrapping di Kaggle: [Kaggle Dataset - Instagram Influencer and Brand](https://www.kaggle.com/datasets/azrilfahmiardi/instagram-influencer-and-brand)
## Cara Penggunaan
```python
from transformers import BertTokenizer, BertForSequenceClassification
import torch
model = BertForSequenceClassification.from_pretrained("AzrilFahmiardi/instagram-comments-classifier-bert")
tokenizer = BertTokenizer.from_pretrained("AzrilFahmiardi/instagram-comments-classifier-bert")
text = "Komentar contoh di sini"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs)
pred = torch.argmax(outputs.logits, dim=1)
```
## Label Kategori
Label yang digunakan dapat dilihat pada file `label_names.json` di repo ini.
## Lisensi
Model ini hanya untuk keperluan riset dan non-komersial.
|