aya99ma commited on
Commit
e8977f7
·
verified ·
1 Parent(s): 61de7be

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +71 -0
README.md ADDED
@@ -0,0 +1,71 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: ar
3
+ license: apache-2.0
4
+ library_name: transformers
5
+ pipeline_tag: text-classification
6
+ tags:
7
+ - arabic
8
+ - medical
9
+ - nlp
10
+ - bert
11
+ - text-classification
12
+ metrics:
13
+ - accuracy
14
+ - f1
15
+ base_model: aubmindlab/bert-base-arabertv02
16
+ datasets:
17
+ - Ahmed-Selem/Shifaa_Arabic_Medical_Consultations
18
+ ---
19
+
20
+ # 🩺 Shifaa Medical Question Classifier | مصنّف أسئلة شفاء الطبية
21
+
22
+ ## العربية
23
+ ### نظرة عامة
24
+ هذا الموديل يقوم **بتصنيف الأسئلة الطبية العربية** إلى **16 فئة** (تخصص/قسم طبي متوقع) باستخدام **AraBERT** بعد Fine-tuning على بيانات منصة شفاء.
25
+
26
+ - **المهمة:** تصنيف نصوص متعدد الفئات (16 فئة)
27
+ - **اللغة:** العربية
28
+ - **أفضل النتائج:** Accuracy ≈ **0.82** | F1-macro ≈ **0.70**
29
+ - **المخرجات:** اسم الفئة المتوقعة + احتمالية (Confidence)
30
+
31
+ ### الفئات (16)
32
+ 0. أمراض الأطفال ومشاكلهم
33
+ 1. أمراض الباطنية والصدر
34
+ 2. أمراض الجلدية
35
+ 3. أمراض الجهاز البولي والتناسلي
36
+ 4. أمراض الجهاز العصبي
37
+ 5. أمراض الدم والأورام
38
+ 6. أمراض الرأس
39
+ 7. أمراض العضلات
40
+ 8. أمراض العظام
41
+ 9. أمراض الغدد والهرمونات
42
+ 10. أمراض النساء والولادة
43
+ 11. الأدوية والمستحضرات
44
+ 12. الجراحة العامة والتجميل
45
+ 13. الصحة البدنية
46
+ 14. الطب البديل
47
+ 15. شئون طبية ومشاكل متفرقة
48
+
49
+ ### طريقة الاستخدام (Transformers)
50
+ ```python
51
+ from transformers import AutoTokenizer, AutoModelForSequenceClassification
52
+ import torch
53
+
54
+ MODEL_ID = "aya99ma/shifaa-bert-classifier"
55
+
56
+ tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
57
+ model = AutoModelForSequenceClassification.from_pretrained(MODEL_ID)
58
+ model.eval()
59
+
60
+ text = "لدي صداع شديد منذ يومين"
61
+ inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
62
+
63
+ with torch.inference_mode():
64
+ logits = model(**inputs).logits
65
+ probs = torch.softmax(logits, dim=-1)[0]
66
+
67
+ pred_id = int(torch.argmax(probs))
68
+ label = model.config.id2label[pred_id]
69
+ confidence = float(probs[pred_id])
70
+
71
+ print(label, confidence)