📑 مدل NER اختصاصی برای آدرس‌های فارسی

🏛 معرفی

این مدل محصول جانبی و ریز تنظیم شده شده مدل پایه fa-address-bert-small است. هدف اصلی از تولید این مدل، تشخیص موجودیت‌های نامدار در آدرس‌های فارسی شامل مناطق جغرافیایی، معابر و اماکن است. این مدل برای استفاده در فرآیندهای استانداردسازی و استخراج اطلاعات مکانی طراحی شده است.

📂 داده‌های آموزشی

مدل روی حدود 10,000 آدرس واقعی حاشیه نویسی شده آموزش دیده است. داده‌ها شامل طیف وسیعی از ساختارهای آدرس واقعی در ایران بوده و به‌صورت دستی حاشیه نویسی شده‌اند تا موجودیت‌هایی مانند:

تقسیمات کشوری
معابر
اماکن

تشخیص داده شوند.

⚙️ معماری و پایه مدل

Base model: fa-address-bert-small
Tokenizer: اختصاصی بر اساس آدرس‌های فارسی
Framework: PyTorch
Task: Named Entity Recognition (NER)

🧪 ارزیابی عملکرد

نتایج ارزیابی کارایی مدل روی داده‌های اعتبارسنجی به شرح زیر است:

معیار	مقدار
Loss	0.2014
Precision	0.9304
Recall	0.9463
F1 Score	0.9383
Accuracy	0.9689

🧾 نحوه استفاده

import spacy
from transformers import pipeline

ner_pipeline = pipeline("ner", model="IRI2070/fa-address-bert-small-ner", aggregation_strategy="simple")

text = "تهران کارون نرسیده به خ آذربایجان جنب بیمارستان شهریار کوچه شهید جاوید زاده پلاک ۲ طبقه ۲ واحد ۴"
hf_entities = ner_pipeline(text)

nlp = spacy.blank("fa")
doc = nlp(text)

spans = []
for ent in hf_entities:
    start = ent['start']
    end = ent['end']
    label = ent['entity_group']
    span = doc.char_span(start, end, label=label)
    if span:
        spans.append(span)

doc.ents = spacy.util.filter_spans(spans)

print(doc.ents)
# (تهران, کارون, خ آذربایجان, بیمارستان شهریار, کوچه شهید جاوید زاده)

Downloads last month: 9

Safetensors

Model size

28.5M params

Tensor type

F32

Model tree for IRI2070/fa-address-bert-small-ner

Base model

lyeonii/bert-small

Finetuned

IRI2070/fa-address-bert-small

Finetuned

(2)

this model

Collection including IRI2070/fa-address-bert-small-ner

Fa Address BERT

Collection

This collection is a set of proprietary Persian address models developed using government and non-government data. • 3 items • Updated 26 days ago

IRI2070
/

fa-address-bert-small-ner