🩺 Shifaa Medical Question Classifier | مصنّف أسئلة شفاء الطبية

العربية

نظرة عامة

هذا الموديل يقوم بتصنيف الأسئلة الطبية العربية إلى 16 فئة (تخصص/قسم طبي متوقع) باستخدام AraBERT بعد Fine-tuning على بيانات منصة شفاء.

المهمة: تصنيف نصوص متعدد الفئات (16 فئة)
اللغة: العربية
أفضل النتائج: Accuracy ≈ 0.82 | F1-macro ≈ 0.70
المخرجات: اسم الفئة المتوقعة + احتمالية (Confidence)

روابط المشروع

🔗 Live Demo (Streamlit): https://shifaa-app-app-kphfdr6vpdwjnhkfirlgpu.streamlit.app/
🧾 GitHub Repository: https://github.com/Ayama11/shifaa-streamlit-app
🤗 Model on HuggingFace: https://huggingface.co/aya99ma/shifaa-bert-classifier
📦 Dataset: https://huggingface.co/datasets/Ahmed-Selem/Shifaa_Arabic_Medical_Consultations

الفئات (16)

أمراض الأطفال ومشاكلهم
أمراض الباطنية والصدر
أمراض الجلدية
أمراض الجهاز البولي والتناسلي
أمراض الجهاز العصبي
أمراض الدم والأورام
أمراض الرأس
أمراض العضلات
أمراض العظام
أمراض الغدد والهرمونات
أمراض النساء والولادة
الأدوية والمستحضرات
الجراحة العامة والتجميل
الصحة البدنية
الطب البديل
شئون طبية ومشاكل متفرقة

طريقة الاستخدام (Transformers)

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

MODEL_ID = "aya99ma/shifaa-bert-classifier"

tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
model = AutoModelForSequenceClassification.from_pretrained(MODEL_ID)
model.eval()

text = "لدي صداع شديد منذ يومين"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)

with torch.inference_mode():
    logits = model(**inputs).logits
    probs = torch.softmax(logits, dim=-1)[0]

pred_id = int(torch.argmax(probs))
label = model.config.id2label[pred_id]
confidence = float(probs[pred_id])

print(label, confidence)

Downloads last month: 3

Safetensors

Model size

0.1B params

Tensor type

F32

Model tree for aya99ma/shifaa-bert-classifier

Base model

aubmindlab/bert-base-arabertv02

Finetuned

(4039)

this model

aya99ma
/

shifaa-bert-classifier