🩺 Shifaa Medical Question Classifier | مصنّف أسئلة شفاء الطبية
العربية
نظرة عامة
هذا الموديل يقوم بتصنيف الأسئلة الطبية العربية إلى 16 فئة (تخصص/قسم طبي متوقع) باستخدام AraBERT بعد Fine-tuning على بيانات منصة شفاء.
- المهمة: تصنيف نصوص متعدد الفئات (16 فئة)
- اللغة: العربية
- أفضل النتائج: Accuracy ≈ 0.82 | F1-macro ≈ 0.70
- المخرجات: اسم الفئة المتوقعة + احتمالية (Confidence)
روابط المشروع
- 🔗 Live Demo (Streamlit): https://shifaa-app-app-kphfdr6vpdwjnhkfirlgpu.streamlit.app/
- 🧾 GitHub Repository: https://github.com/Ayama11/shifaa-streamlit-app
- 🤗 Model on HuggingFace: https://huggingface.co/aya99ma/shifaa-bert-classifier
- 📦 Dataset: https://huggingface.co/datasets/Ahmed-Selem/Shifaa_Arabic_Medical_Consultations
الفئات (16)
- أمراض الأطفال ومشاكلهم
- أمراض الباطنية والصدر
- أمراض الجلدية
- أمراض الجهاز البولي والتناسلي
- أمراض الجهاز العصبي
- أمراض الدم والأورام
- أمراض الرأس
- أمراض العضلات
- أمراض العظام
- أمراض الغدد والهرمونات
- أمراض النساء والولادة
- الأدوية والمستحضرات
- الجراحة العامة والتجميل
- الصحة البدنية
- الطب البديل
- شئون طبية ومشاكل متفرقة
طريقة الاستخدام (Transformers)
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
MODEL_ID = "aya99ma/shifaa-bert-classifier"
tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
model = AutoModelForSequenceClassification.from_pretrained(MODEL_ID)
model.eval()
text = "لدي صداع شديد منذ يومين"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
with torch.inference_mode():
logits = model(**inputs).logits
probs = torch.softmax(logits, dim=-1)[0]
pred_id = int(torch.argmax(probs))
label = model.config.id2label[pred_id]
confidence = float(probs[pred_id])
print(label, confidence)
- Downloads last month
- 32
Model tree for aya99ma/shifaa-bert-classifier
Base model
aubmindlab/bert-base-arabertv02