Spaces:

ujjwalpardeshi
/

pytorch-training-debugger

Sleeping

UjjwalPardeshi commited on Apr 7

Commit

f1b57dc

1 Parent(s): 9bb9fe6

fix graders

Files changed (2) hide show

inference.py CHANGED Viewed

@@ -254,7 +254,7 @@ async def main() -> None:
                 break
         score = sum(rewards) / MAX_TOTAL_REWARD if MAX_TOTAL_REWARD > 0 else 0.0
-        score = min(max(score, 0.0), 1.0)  # clamp to [0, 1]
         success = score >= SUCCESS_SCORE_THRESHOLD
     except Exception as exc:

                 break
         score = sum(rewards) / MAX_TOTAL_REWARD if MAX_TOTAL_REWARD > 0 else 0.0
+        score = min(max(score, 0.01), 0.99)  # clamp to (0, 1) exclusive
         success = score >= SUCCESS_SCORE_THRESHOLD
     except Exception as exc:

ml_training_debugger/graders.py CHANGED Viewed

@@ -277,8 +277,10 @@ GRADERS = {
 def grade_episode(task_id: str, state: EpisodeState, scenario: ScenarioParams) -> float:
-    """Grade a completed episode. Returns 0.0-1.0."""
     grader = GRADERS.get(task_id)
     if grader is None:
-        return 0.0
-    return grader(state, scenario)

 def grade_episode(task_id: str, state: EpisodeState, scenario: ScenarioParams) -> float:
+    """Grade a completed episode. Returns score in (0.0, 1.0) exclusive."""
     grader = GRADERS.get(task_id)
     if grader is None:
+        return 0.01
+    score = grader(state, scenario)
+    # Clamp to strictly between 0 and 1 (evaluator rejects exact 0.0 and 1.0)
+    return max(0.01, min(0.99, score))