File size: 2,054 Bytes
91ac57d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71

 # Indonesia Named Entity Recognition (NER) using BERT

Aplikasi berbasis **Streamlit** untuk mendeteksi entitas bernama (*Named Entity Recognition / NER*) pada teks berbahasa Indonesia menggunakan **BERT (Bidirectional Encoder Representations from Transformers)** yang telah di-*fine-tune*.  
Proyek ini dirancang untuk kebutuhan analisis teks domain medis, namun dapat dikembangkan untuk domain lain seperti berita, hukum, atau sosial media.
<img width="2880" height="2216" alt="localhost_8501_ (4)" src="https://github.com/user-attachments/assets/b5da265f-d07c-4aeb-9f56-ce377fc8a985" />

---

## πŸš€ **Fitur Utama**
- πŸ” **Prediksi otomatis entitas** (mis. nama penyakit, spesies, lokasi, dsb.) dari teks input.
- 🎨 **Highlight visual interaktif** untuk setiap entitas yang terdeteksi.
- βš™οΈ **Berbasis model BERT yang telah di-fine-tune** untuk tugas token classification.
- πŸ“Š **Tabel hasil entitas** yang dapat diperluas (expandable).
- πŸ’» **Aplikasi berbasis web (Streamlit)** β€” berjalan lokal maupun di-deploy ke cloud.

---

## 🧠 **Model yang Digunakan**
Model menggunakan arsitektur **BERT (Bidirectional Encoder Representations from Transformers)** yang telah di-*fine-tune* pada dataset NER Bahasa Indonesia.  
Struktur folder model:

fine_tuned_bert_ner/

β”‚

β”œβ”€β”€ config.json



β”œβ”€β”€ pytorch_model.bin

β”œβ”€β”€ tokenizer_config.json



β”œβ”€β”€ vocab.txt



└── special_tokens_map.json





Pastikan folder ini berada **satu direktori** dengan file `app.py`.



---



## πŸ› οΈ **Cara Menjalankan Proyek**



### 1️⃣ Clone Repository

```bash

git clone https://github.com/decoderr24/Indonesian-NER-using-BERT.git

cd Indonesian-NER-using-BERT

```

2️⃣ Install Dependencies



Gunakan Python 3.8+ dan jalankan:



```bash

pip install -r requirements.txt



```





Atau manual:

```bash

pip install streamlit torch transformers pandas

```

3️⃣ Jalankan Aplikasi

```bash

streamlit run app.py

```

Kemudian buka browser di:





http://localhost:8501