Spaces:

savetrees
/

bug-triage-openenv

Sleeping

savetrees commited on 3 days ago

Commit

8b20389

verified ·

1 Parent(s): c3fb458

Upload folder using huggingface_hub

Files changed (3) hide show

bug_triage_env/graders/task1_grader.py CHANGED Viewed

@@ -19,13 +19,13 @@ def grade(episode_log: List[Dict[str, Any]], ground_truth: Dict[str, Any]) -> fl
         Score in [0.0, 1.0].
     """
     if not episode_log:
-        return 0.0
     last_action = episode_log[-1]
     predicted = (last_action.get("bug_type") or "").strip().lower()
     expected = (ground_truth.get("bug_type") or "").strip().lower()
     if not predicted:
-        return 0.0
-    return 1.0 if predicted == expected else 0.0

         Score in [0.0, 1.0].
     """
     if not episode_log:
+        return 0.01
     last_action = episode_log[-1]
     predicted = (last_action.get("bug_type") or "").strip().lower()
     expected = (ground_truth.get("bug_type") or "").strip().lower()
     if not predicted:
+        return 0.01
+    return 0.99 if predicted == expected else 0.01

bug_triage_env/graders/task2_grader.py CHANGED Viewed

@@ -27,17 +27,17 @@ def grade(episode_log: List[Dict[str, Any]], ground_truth: Dict[str, Any]) -> fl
         float score in [0.0, 1.0].
     """
     if not episode_log:
-        return 0.0
     last_action = episode_log[-1]
     predicted = (last_action.get("priority") or "").strip().lower()
     expected = (ground_truth.get("priority") or "").strip().lower()
     if not predicted or predicted not in PRIORITY_ORDER:
-        return 0.0
     if expected not in PRIORITY_ORDER:
-        return 0.0
     diff = abs(PRIORITY_ORDER[predicted] - PRIORITY_ORDER[expected])
     score = 1.0 - diff * (1.0 / 3.0)
-    return max(0.0, min(1.0, score))

         float score in [0.0, 1.0].
     """
     if not episode_log:
+        return 0.01
     last_action = episode_log[-1]
     predicted = (last_action.get("priority") or "").strip().lower()
     expected = (ground_truth.get("priority") or "").strip().lower()
     if not predicted or predicted not in PRIORITY_ORDER:
+        return 0.01
     if expected not in PRIORITY_ORDER:
+        return 0.01
     diff = abs(PRIORITY_ORDER[predicted] - PRIORITY_ORDER[expected])
     score = 1.0 - diff * (1.0 / 3.0)
+    return max(0.01, min(0.99, score))

bug_triage_env/graders/task3_grader.py CHANGED Viewed

@@ -85,7 +85,7 @@ def grade(episode_log: List[Dict[str, Any]], ground_truth: Dict[str, Any]) -> fl
         float score in [0.0, 1.0].
     """
     if not episode_log:
-        return 0.0
     action = episode_log[-1]
@@ -111,4 +111,4 @@ def grade(episode_log: List[Dict[str, Any]], ground_truth: Dict[str, Any]) -> fl
         + WEIGHTS["action"] * s_act
     )
-    return max(0.0, min(1.0, round(score, 4)))

         float score in [0.0, 1.0].
     """
     if not episode_log:
+        return 0.01
     action = episode_log[-1]
         + WEIGHTS["action"] * s_act
     )
+    return max(0.01, min(0.99, round(score, 4)))