Spaces:

mii-llm
/

open_ita_llm_leaderboard

Running on CPU Upgrade

giux78 commited on May 17, 2024

Commit

eef918c

verified ·

1 Parent(s): a6a86b1

Update app.py (#13)

- Update app.py (fcdba52d99dc573b68256bafc611d94d461f24ea)

Co-authored-by: Alessandro Ercolani <giux78@users.noreply.huggingface.co>

Files changed (1) hide show

app.py CHANGED Viewed

@@ -131,6 +131,12 @@ def filter_models(
     return filtered_df
 demo = gr.Blocks(css=custom_css)
 with demo:
@@ -238,7 +244,24 @@ with demo:
                     leaderboard_table,
                     queue=True,
                 )
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")

     return filtered_df
+def get_data_totale():
+    dataset = pd.read_csv("leaderboard_general.csv", sep=',')
+    if 'model ' in dataset.columns:
+        dataset.rename(columns={'model ': 'model'}, inplace=True)
+    return dataset
 demo = gr.Blocks(css=custom_css)
 with demo:
                     leaderboard_table,
                     queue=True,
                 )
+        with gr.TabItem('Classifica RAG'):
+                gr.Markdown('''# Classifica RAG degli LLM italiani''')
+                gr.Markdown(f'''In questa sezione i modelli sono valutati su dei task di Q&A e ordinati per F1 Score e EM (Exact Match). La repo di riferimento è [questa](https://github.com/C080/open-llm-ita-leaderboard).
+                            I modelli in cima alla classifica sono ritenuti preferibili per i task di Retrieval Augmented Generation.''')
+                gr.Dataframe(pd.read_csv(csv_filename, sep=';'))
+                gr.Markdown(f"Si ringrazia il @galatolo per il codice dell'eval.")
+        with gr.TabItem('Eval aggiuntive'):
+                gr.Markdown('''# Altre  evaluation''')
+                gr.Markdown('''Qui ci sono altri test di altri modelli valutati su molte metriche''')
+                gr.Dataframe(get_data_totale)
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")