Spaces:

BreakLee
/

SEED-Bench

Sleeping

App Files Files Community

BreakLee commited on Aug 15, 2023

Commit

10b3494

1 Parent(s): b612e30

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -6

app.py CHANGED Viewed

@@ -33,7 +33,15 @@ def prediction_analyse(prediction_content):
     # 遍历 predictions，计算每个 question_type_id 的正确预测数和总预测数
     for prediction in predictions:
-        prediction = json.loads(prediction)
         question_id = prediction["question_id"]
         gt_item = ground_truth[question_id]
         question_type_id = gt_item["question_type_id"]
@@ -77,10 +85,16 @@ def add_new_eval(
             LLM_name = LLM_name_textbox
         else:
             LLM_name = LLM_type
         # add new data
         new_data = [
             model_type,
-            model_name_textbox,
             LLM_name,
             each_task_accuracy[1],
             each_task_accuracy[2],
@@ -148,7 +162,6 @@ with block:
                 )
             def on_checkbox_group_change(selected_columns):
-                print("TEst")
                 # pdb.set_trace()
                 selected_columns = [item for item in TASK_INFO if item in selected_columns]
                 present_columns = MODEL_INFO + selected_columns
@@ -156,8 +169,6 @@ with block:
                 updated_headers = present_columns
                 update_datatype = [DATA_TITILE_TYPE[COLUMN_NAMES.index(x)] for x in updated_headers]
-                # data_component.update(value=updated_data, headers=updated_headers, datatype=update_datatype)
                 filter_component = gr.components.Dataframe(
                     value=updated_data,
                     headers=updated_headers,
@@ -202,7 +213,7 @@ with block:
                         ],
                         label="Model type",
                         multiselect=False,
-                        value="LLaMA-7B",
                         interactive=True,
                     )
                     model_link = gr.Textbox(

     # 遍历 predictions，计算每个 question_type_id 的正确预测数和总预测数
     for prediction in predictions:
+        # pdb.set_trace()
+        prediction = prediction.strip()
+        if not prediction:
+            continue
+        try:
+            prediction = json.loads(prediction)
+        except json.JSONDecodeError:
+            print(f"Warning: Skipping invalid JSON data in line: {prediction}")
+            continue
         question_id = prediction["question_id"]
         gt_item = ground_truth[question_id]
         question_type_id = gt_item["question_type_id"]
             LLM_name = LLM_name_textbox
         else:
             LLM_name = LLM_type
+        pdb.set_trace()
+        if model_link == '':
+            model_name = model_name_textbox  # no url
+        else:
+            model_name = '[' + model_name_textbox + '](' + model_link + ')'
         # add new data
         new_data = [
             model_type,
+            model_name,
             LLM_name,
             each_task_accuracy[1],
             each_task_accuracy[2],
                 )
             def on_checkbox_group_change(selected_columns):
                 # pdb.set_trace()
                 selected_columns = [item for item in TASK_INFO if item in selected_columns]
                 present_columns = MODEL_INFO + selected_columns
                 updated_headers = present_columns
                 update_datatype = [DATA_TITILE_TYPE[COLUMN_NAMES.index(x)] for x in updated_headers]
                 filter_component = gr.components.Dataframe(
                     value=updated_data,
                     headers=updated_headers,
                         ],
                         label="Model type",
                         multiselect=False,
+                        value=ModelType.FT.to_str(" : "),
                         interactive=True,
                     )
                     model_link = gr.Textbox(