test / leaderboard.md
Hrant's picture
Update leaderboard via Leaderboarder
1ac264d verified

A newer version of the Gradio SDK is available: 6.9.0

Upgrade
model_name score EASI-50 Time EASI percent reduction EASI-50 response VSI [66] SITE [57] MMSI [68] OmniSpatial [23] MindCube ∗ [69] STARE [32] CoreCognition [33] SpatialViz [55] EASI 75 achievement rate EASI score reduction (%) percentage MIC efficiency specificity median EASI source_title source_url notes
abrocitinib 200 mg QD 86.6 86.6 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Combination therapy RCTs
Upadacitinib 85.6 nan Week 12 85.6% nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan The efficacy and safety of upadacitinib treatment for moderate to severe atopic dermatitis in real‐world practice in Japan https://doi.org/10.1111/1346-8138.16549 Median percent reduction in EASI at week 12 with Upadacitinib 15 mg/day plus topical corticosteroids.
upadacitinib 30 mg once daily (QD) 83.6 nan nan nan 83.6 nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Monotherapy RCTs
dupilumab 300 mg Q2W 82.4 82.4 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Combination therapy RCTs
abrocitinib 100 mg QD 79.7 79.7 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Combination therapy RCTs
Human 79.2 nan nan nan nan 79.2 67.5 97.2 92.63 94.55 96.5 86.98 82.46 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
abrocitinib 200 mg QD 74.6 nan nan nan 74.6 nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Monotherapy RCTs
Upadacitinib 73.6 nan Week 4 73.6% nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan The efficacy and safety of upadacitinib treatment for moderate to severe atopic dermatitis in real‐world practice in Japan https://doi.org/10.1111/1346-8138.16549 Median percent reduction in EASI at week 4 with Upadacitinib 15 mg/day plus topical corticosteroids.
upadacitinib 15 mg QD 70.5 nan nan nan 70.5 nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Monotherapy RCTs
Upadacitinib 67.7 nan Week 12 nan nan nan nan nan nan nan nan nan nan 67.7% nan nan nan nan nan The efficacy and safety of upadacitinib treatment for moderate to severe atopic dermatitis in real‐world practice in Japan https://doi.org/10.1111/1346-8138.16549 Achievement rate of EASI 75 at week 12 with Upadacitinib 15 mg/day plus topical corticosteroids.
dupilumab 300 mg every 2 weeks (Q2W) 63.4 nan nan nan 63.4 nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Monotherapy RCTs
Qwen3-8B-Instruct [65] 57.9 nan nan nan nan 57.9 45.83 31.1 45.73 29.42 39.76 69.67 17.54 † nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf † indicates cases where generations were truncated due to overlong chains of thought, yielding no final answer; such instances are counted as incorrect, which depresses the score.
abrocitinib 100 mg QD 56.7 nan nan nan 56.7 nan nan nan nan nan nan nan nan nan nan nan nan nan nan Comparative efficacy and safety of systemic therapies used in moderate‐to‐severe atopic dermatitis: a systematic literature review and network meta‐analysis https://doi.org/10.1111/jdv.17351 Monotherapy RCTs
InternVL3.5-8B [56] 56.05 nan nan nan nan 56.05 43.79 27.3 46.71 42.5 40.18 66.4 23.98 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
GPT-5-2025-08-07 [45] 55.03 nan nan nan nan 55.03 61.88 41.8 59.9 56.3 54.59 84.37 51.27 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Gemini-2.5-pro-2025-06 [52] 53.57 nan nan nan nan 53.57 57.06 38 55.38 57.6 49.14 76.7 42.71 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Upadacitinib 51.6 nan Week 4 nan nan nan nan nan nan nan nan nan nan 51.6% nan nan nan nan nan The efficacy and safety of upadacitinib treatment for moderate to severe atopic dermatitis in real‐world practice in Japan https://doi.org/10.1111/1346-8138.16549 Achievement rate of EASI 75 at week 4 with Upadacitinib 15 mg/day plus topical corticosteroids.
high dose hUCB-MSC 50 nan nan nan nan nan nan nan nan nan nan nan nan nan 50 nan nan nan nan Clinical Trial of Human Umbilical Cord Blood-Derived Stem Cells for the Treatment of Moderate-to-Severe Atopic Dermatitis: Phase I/IIa Studies https://doi.org/10.1002/stem.2401 Fifty-five percent of patients in high dose hUCB-MSC-treated group showed a 50% reduction in the EASI score.
EASI 50 50 nan nan nan nan nan nan nan nan nan nan nan nan nan nan 50 nan nan nan What are the best endpoints for Eczema Area and Severity Index and Scoring Atopic Dermatitis in clinical practice? A prospective observational study* https://doi.org/10.1111/bjd.19457 Meaningful percentage MIC regardless of baseline AD severity.
Seed-1.6-2025-06-15 [51] 49.91 nan nan nan nan 49.91 54.61 38.3 49.32 48.75 46.06 77.17 34.58 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
GPT-5-mini-2025-08-07 [45] 48.67 nan nan nan nan 48.67 52.47 34.1 55.52 56.69 52.51 77.77 44.66 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Grok-4-2025-07-09 [62] 47.92 nan nan nan nan 47.92 47.01 37.8 46.84 63.56 26.9 79.27 19.40 † nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf † indicates cases where generations were truncated due to overlong chains of thought, yielding no final answer; such instances are counted as incorrect, which depresses the score.
InternVL3-78B [79] 47.55 nan nan nan nan 47.55 52.72 30.5 50.95 49.52 42 71.16 31.10 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
GPT-5-nano-2025-08-07 [45] 43.22 nan nan nan nan 43.22 35.81 28.9 47.81 41.48 46.05 67.92 35.59 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
InternVL3-8B [79] 42.14 nan nan nan nan 42.14 41.15 28 46.25 41.54 41.36 60.92 30.00 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Qwen2.5-VL-72B-Instruct [1] 35.77 nan nan nan nan 35.77 47.41 32.5 47.81 42.4 38.37 69.22 32.54 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Random Choice 34 nan nan nan nan 34 0 25 24.98 32.35 34.8 33.93 25.08 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf VSI random choice here is chance level(Frequency).
Qwen2.5-VL-7B-Instruct [1] 32.3 nan nan nan nan 32.3 37.64 26.8 39.07 36.05 35.03 62.16 26.78 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
Easi-CRISPR 30 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan 30–60% nan nan Easi-CRISPR for creating knock-in and conditional knockout mouse models using long ssDNA donors https://doi.org/10.1038/nprot.2017.153 Typically 30-60% efficiency, reaching as high as 100% in some cases.
Qwen2.5-VL-3B-Instruct [1] 27 nan nan nan nan 27 33.14 28.6 42.47 37.6 37.83 60.19 21.86 nan nan nan nan nan nan EASI https://arxiv.org/pdf/2508.13142.pdf None
EASI 0.47 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan 0.75 nan Development and Validation of a Tool to Improve Physician Identification of Elder Abuse: The Elder Abuse Suspicion Index (EASI)© https://doi.org/10.1080/08946560801973168 The EASI had an estimated sensitivity and specificity of 0.47 and 0.75
placebo -1.3 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan -1.3 Phase 2a, randomized, double‐blind, placebo‐controlled, multicenter, parallel‐group study of a H4R‐antagonist (JNJ‐39758979) inJapanese adults with moderate atopic dermatitis https://doi.org/10.1111/1346-8138.12726 at week 6
JNJ-39758979 300 mg -3 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan -3 Phase 2a, randomized, double‐blind, placebo‐controlled, multicenter, parallel‐group study of a H4R‐antagonist (JNJ‐39758979) inJapanese adults with moderate atopic dermatitis https://doi.org/10.1111/1346-8138.12726 at week 6
JNJ-39758979 100 mg -3.7 nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan nan -3.7 Phase 2a, randomized, double‐blind, placebo‐controlled, multicenter, parallel‐group study of a H4R‐antagonist (JNJ‐39758979) inJapanese adults with moderate atopic dermatitis https://doi.org/10.1111/1346-8138.12726 at week 6