File size: 2,054 Bytes
91ac57d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 |
# Indonesia Named Entity Recognition (NER) using BERT
Aplikasi berbasis **Streamlit** untuk mendeteksi entitas bernama (*Named Entity Recognition / NER*) pada teks berbahasa Indonesia menggunakan **BERT (Bidirectional Encoder Representations from Transformers)** yang telah di-*fine-tune*.
Proyek ini dirancang untuk kebutuhan analisis teks domain medis, namun dapat dikembangkan untuk domain lain seperti berita, hukum, atau sosial media.
<img width="2880" height="2216" alt="localhost_8501_ (4)" src="https://github.com/user-attachments/assets/b5da265f-d07c-4aeb-9f56-ce377fc8a985" />
---
## π **Fitur Utama**
- π **Prediksi otomatis entitas** (mis. nama penyakit, spesies, lokasi, dsb.) dari teks input.
- π¨ **Highlight visual interaktif** untuk setiap entitas yang terdeteksi.
- βοΈ **Berbasis model BERT yang telah di-fine-tune** untuk tugas token classification.
- π **Tabel hasil entitas** yang dapat diperluas (expandable).
- π» **Aplikasi berbasis web (Streamlit)** β berjalan lokal maupun di-deploy ke cloud.
---
## π§ **Model yang Digunakan**
Model menggunakan arsitektur **BERT (Bidirectional Encoder Representations from Transformers)** yang telah di-*fine-tune* pada dataset NER Bahasa Indonesia.
Struktur folder model:
fine_tuned_bert_ner/
β
βββ config.json
βββ pytorch_model.bin
βββ tokenizer_config.json
βββ vocab.txt
βββ special_tokens_map.json
Pastikan folder ini berada **satu direktori** dengan file `app.py`.
---
## π οΈ **Cara Menjalankan Proyek**
### 1οΈβ£ Clone Repository
```bash
git clone https://github.com/decoderr24/Indonesian-NER-using-BERT.git
cd Indonesian-NER-using-BERT
```
2οΈβ£ Install Dependencies
Gunakan Python 3.8+ dan jalankan:
```bash
pip install -r requirements.txt
```
Atau manual:
```bash
pip install streamlit torch transformers pandas
```
3οΈβ£ Jalankan Aplikasi
```bash
streamlit run app.py
```
Kemudian buka browser di:
http://localhost:8501
|