TAG-Leaderboard

Running

abiswal commited on Feb 13

Commit

f4d957a

1 Parent(s): 453def2

update

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,27 +12,27 @@ from src.about import (
 data = {
     "Method": [
-        #"Handwritten LOTUS (Llama-3.1-70B)",
-        #"Zero-shot Text2SQL (Llama-3.1-70B)",
-        #"Zero-shot Text2SQL + LM Generation (Llama-3.1-70B)",
-        "RAG (E5) (Llama-3.1-70B)",
         "RAG (E5) + LM Rerank (Llama-3.1-70B)",
         "Handwritten LOTUS (GPT-4o)",
         "Zero-shot Text2SQL (GPT-4o)",
-       # "Zero-shot Text2SQL + LM Generation (GPT-4o)",
-        "RAG (GPT-4o)",
         "RAG (E5) + LM Rerank (GPT-4o)",
         "Handwritten LOTUS (o3-mini)",
         "Zero-shot Text2SQL (o3-mini)",
-        #"Zero-shot Text2SQL + LM Generation (o3-mini)",
-        "RAG (o3-mini)",
         "RAG (E5) + LM Rerank (o3-mini)",
         "Zero-shot Text2SQL (Deepseek-R1)",
-        #"Zero-shot Text2SQL + LM Generation (Deepseek-R1)",
     ],
     # "Model": ["meta-llama/Llama-3.1-70B"] * 5,
-    # "Execution Accuracy": [55.0, 17.0, 13.0, 0.0, 2.0, 55.0, 18.0, 15.0, 3.0, 3.0, 65.0, 18.0, 30.0, 7.0, 7.0, 12.0, 0.0],
-    "Execution Accuracy": [0.0, 2.0, 55.0, 18.0, 3.0, 3.0, 65.0, 18.0, 7.0, 7.0, 12.0],
 }
 leaderboard_df = pd.DataFrame(data)
@@ -43,7 +43,7 @@ leaderboard_df = leaderboard_df.sort_values(
 leaderboard_df.insert(0, "Rank", leaderboard_df.index - 1)
 leaderboard_df.loc[0, "Rank"] = ""
 leaderboard_df.loc[1, "Rank"] = ""
-# leaderboard_df.loc[2, "Rank"] = ""
 def hyperlink_method(method):
     base_url = "https://github.com/TAG-Research/TAG-Bench/tree/main"

 data = {
     "Method": [
+        "Handwritten LOTUS (Llama-3.1-70B)",
+        "Zero-shot Text2SQL (Llama-3.1-70B)",
+        "Zero-shot Text2SQL + LM Generation (Llama-3.1-70B)",
+        "RAG (E5 + Llama-3.1-70B)",
         "RAG (E5) + LM Rerank (Llama-3.1-70B)",
         "Handwritten LOTUS (GPT-4o)",
         "Zero-shot Text2SQL (GPT-4o)",
+       "Zero-shot Text2SQL + LM Generation (GPT-4o)",
+        "RAG (E5 + GPT-4o)",
         "RAG (E5) + LM Rerank (GPT-4o)",
         "Handwritten LOTUS (o3-mini)",
         "Zero-shot Text2SQL (o3-mini)",
+        "Zero-shot Text2SQL + LM Generation (o3-mini)",
+        "RAG (E5 + o3-mini)",
         "RAG (E5) + LM Rerank (o3-mini)",
         "Zero-shot Text2SQL (Deepseek-R1)",
+        "Zero-shot Text2SQL + LM Generation (Deepseek-R1)",
     ],
     # "Model": ["meta-llama/Llama-3.1-70B"] * 5,
+    "Execution Accuracy": [55.0, 17.0, 13.0, 0.0, 2.0, 55.0, 18.0, 15.0, 3.0, 3.0, 65.0, 18.0, 30.0, 7.0, 7.0, 12.0, 0.0],
+    # "Execution Accuracy": [0.0, 2.0, 55.0, 18.0, 3.0, 3.0, 65.0, 18.0, 7.0, 7.0, 12.0],
 }
 leaderboard_df = pd.DataFrame(data)
 leaderboard_df.insert(0, "Rank", leaderboard_df.index - 1)
 leaderboard_df.loc[0, "Rank"] = ""
 leaderboard_df.loc[1, "Rank"] = ""
+leaderboard_df.loc[2, "Rank"] = ""
 def hyperlink_method(method):
     base_url = "https://github.com/TAG-Research/TAG-Bench/tree/main"