File size: 1,376 Bytes
7c07000
 
 
d6e0d56
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
---
license: mit
---
# Instagram Caption Classifier (Fine-tuned BERT)

Model ini merupakan hasil fine-tuning BERT (`bert-base-uncased`) untuk klasifikasi caption Instagram. Model ini dilatih menggunakan data caption yang telah dilabeli, sehingga dapat digunakan untuk mengklasifikasikan jenis caption pada postingan Instagram.

## Dataset
- Data: Caption Instagram berbahasa Indonesia, sudah dilabeli sesuai kategori relevan.
- Format: CSV, kolom utama: `post_caption`, `label_1`.
- Tersedia juga dataset komentar dan caption influencer Instagram yang sudah kami scrapping di Kaggle: [Kaggle Dataset - Instagram Influencer and Brand](https://www.kaggle.com/datasets/azrilfahmiardi/instagram-influencer-and-brand)

## Cara Penggunaan

```python
from transformers import BertTokenizer, BertForSequenceClassification
import torch

model = BertForSequenceClassification.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert")
tokenizer = BertTokenizer.from_pretrained("AzrilFahmiardi/instagram-caption-classifier-bert")

text = "Caption contoh di sini"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs)
pred = torch.argmax(outputs.logits, dim=1)
```

## Label Kategori
Label yang digunakan dapat dilihat pada file `label_names.json` di repo ini.

## Lisensi
Model ini hanya untuk keperluan riset dan non-komersial.