NER Lokasi Laporan Gubernur Jawa Tengah

Model Named Entity Recognition (NER) untuk mengekstrak entitas lokasi dari laporan ke Gubernur Jawa Tengah.

Model Description

Model ini dilatih untuk mendeteksi entitas lokasi seperti:

Nama Desa
Nama Kecamatan
Nama Kabupaten
Nama Kota

Intended Use

Model ini cocok untuk:

Ekstraksi lokasi dari laporan masyarakat
Analisis teks bahasa Indonesia khususnya Jawa Tengah
Sistem pengaduan masyarakat

How to Use

from transformers import AutoTokenizer, TFAutoModelForTokenClassification, pipeline

# Load model
model_name = "Mozkyy/ner-laporgub-jateng" 
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = TFAutoModelForTokenClassification.from_pretrained(model_name)

# Create pipeline
nlp = pipeline("ner", model=model, tokenizer=tokenizer, aggregation_strategy="simple")

# Test
text = "Jalan rusak di Desa Karanganyar Kabupaten Demak sangat parah"
results = nlp(text)

for entity in results:
    print(f"{entity['word']} -> {entity['entity_group']} (score: {entity['score']:.2f})")

Training Data

Dataset: Laporan masyarakat ke Gubernur Jawa Tengah

Training Procedure

Base Model: IndoBERT/mBERT
Framework: TensorFlow
Task: Token Classification

Limitations

Model dilatih khusus untuk konteks Jawa Tengah
Performa mungkin menurun untuk teks di luar domain

Citation

Jika menggunakan model ini dalam penelitian, mohon sitasi:

@misc{ner-laporgub-jateng,
  author = {Mozkyy},
  title = {NER Model untuk Laporan Gubernur Jawa Tengah},
  year = {2025},
  publisher = {Hugging Face},
  howpublished = {\url{https://huggingface.co/USERNAME/ner-laporgub-jateng}}
}


3. **Ganti `USERNAME`** dengan username Hugging Face Anda

4. **Klik "Commit new file to main"**

## Langkah 6: Verifikasi Upload Berhasil

1. **Cek tab "Files and versions"** - pastikan semua file ada:

✅ README.md ✅ config.json ✅ tf_model.h5 ✅ tokenizer_config.json ✅ vocab.txt (atau tokenizer.json) ✅ special_tokens_map.json

Downloads last month: 5