NER Lokasi Laporan Gubernur Jawa Tengah
Model Named Entity Recognition (NER) untuk mengekstrak entitas lokasi dari laporan ke Gubernur Jawa Tengah.
Model Description
Model ini dilatih untuk mendeteksi entitas lokasi seperti:
- Nama Desa
- Nama Kecamatan
- Nama Kabupaten
- Nama Kota
Intended Use
Model ini cocok untuk:
- Ekstraksi lokasi dari laporan masyarakat
- Analisis teks bahasa Indonesia khususnya Jawa Tengah
- Sistem pengaduan masyarakat
How to Use
from transformers import AutoTokenizer, TFAutoModelForTokenClassification, pipeline
# Load model
model_name = "Mozkyy/ner-laporgub-jateng"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = TFAutoModelForTokenClassification.from_pretrained(model_name)
# Create pipeline
nlp = pipeline("ner", model=model, tokenizer=tokenizer, aggregation_strategy="simple")
# Test
text = "Jalan rusak di Desa Karanganyar Kabupaten Demak sangat parah"
results = nlp(text)
for entity in results:
print(f"{entity['word']} -> {entity['entity_group']} (score: {entity['score']:.2f})")
Training Data
Dataset: Laporan masyarakat ke Gubernur Jawa Tengah
Training Procedure
- Base Model: IndoBERT/mBERT
- Framework: TensorFlow
- Task: Token Classification
Limitations
- Model dilatih khusus untuk konteks Jawa Tengah
- Performa mungkin menurun untuk teks di luar domain
Citation
Jika menggunakan model ini dalam penelitian, mohon sitasi:
@misc{ner-laporgub-jateng,
author = {Mozkyy},
title = {NER Model untuk Laporan Gubernur Jawa Tengah},
year = {2025},
publisher = {Hugging Face},
howpublished = {\url{https://huggingface.co/USERNAME/ner-laporgub-jateng}}
}
3. **Ganti `USERNAME`** dengan username Hugging Face Anda
4. **Klik "Commit new file to main"**
## Langkah 6: Verifikasi Upload Berhasil
1. **Cek tab "Files and versions"** - pastikan semua file ada:
โ README.md โ config.json โ tf_model.h5 โ tokenizer_config.json โ vocab.txt (atau tokenizer.json) โ special_tokens_map.json
- Downloads last month
- 77