Spaces:

XuemeiTang
/

LLM4LitReview_Benchmark

Running

App Files Files Community

tangtang commited on Nov 1, 2025

Commit

03ff9a5

1 Parent(s): 6be31de

Update space1

Browse files

Files changed (2) hide show

app.py +5 -0
src/about.py +0 -19

app.py CHANGED Viewed

@@ -93,7 +93,12 @@ demo = gr.Blocks(css=custom_css)
 with demo:
     gr.HTML(TITLE)
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             leaderboard = init_leaderboard(LEADERBOARD_DF)

 with demo:
     gr.HTML(TITLE)
     gr.Markdown(INTRODUCTION_TEXT, elem_classes="markdown-text")
+    def display_radar_chart():
+        return """
+            <iframe src="https://tangxuemei1995.github.io/LitReview_reusults/clean.html" style="width: 100%; height: 500px; border: none;"></iframe>
+            """
+    gr.HTML(display_radar_chart())
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
             leaderboard = init_leaderboard(LEADERBOARD_DF)

src/about.py CHANGED Viewed

@@ -42,25 +42,6 @@ INTRODUCTION_TEXT = """
 This leaderboard evaluates Large Language Models (LLMs) on their ability to perform automated literature review tasks, including reference generation, abstract writing, and review composition.<br>
 It is based on the study: <b>Large Language Models for Automated Literature Review: An Evaluation of Reference Generation, Abstract Writing, and Review Composition.</b><br>
 The leaderboard measures how well different models perform in references generation, factually consistent, and stylistically appropriate academic texts.<br><br>
-<div style="display:flex; gap:20px; justify-content:space-between;">
-    <div style="text-align:center;">
-        <img src="https://huggingface.co/datasets/XuemeiTang/llm_litReview_images/resolve/main/acc_score.png?raw=true" width="200"><br>
-        Reference Generation: Precision
-    </div>
-    <div style="text-align:center;">
-        <img src="![Abstract Writing: True](https://huggingface.co/datasets/XuemeiTang/llm_litReview_images/resolve/main/t2_true_entailment.png?raw=true)" width="200"><br>
-        Abstract Writing: True
-    </div>
-    <div style="text-align:center;">
-        <img src="https://huggingface.co/datasets/XuemeiTang/llm_litReview_images/resolve/main/acc_score_t3.png?raw=true" width="200"><br>
-        Review Composition: Precision
-    </div>
-    <div style="text-align:center;">
-        <img src="https://huggingface.co/datasets/XuemeiTang/llm_litReview_images/resolve/main/kpr_score.png?raw=true" width="200"><br>
-        Literature Review Writing: KPR
-    </div>
-</div>
 """

 This leaderboard evaluates Large Language Models (LLMs) on their ability to perform automated literature review tasks, including reference generation, abstract writing, and review composition.<br>
 It is based on the study: <b>Large Language Models for Automated Literature Review: An Evaluation of Reference Generation, Abstract Writing, and Review Composition.</b><br>
 The leaderboard measures how well different models perform in references generation, factually consistent, and stylistically appropriate academic texts.<br><br>
 """