Spaces:

vvinayakkkkk
/

meta-hack

Sleeping

App Files Files Community

vvinayakkk commited on Apr 12

Commit

2e410e4

1 Parent(s): f8701a1

Harden API score fields to strict open interval

Browse files

Files changed (4) hide show

clinical-trial-triage/server/app.py +21 -9
clinical-trial-triage/server/openenv_env.py +11 -1
server/app.py +21 -9
server/openenv_env.py +11 -1

clinical-trial-triage/server/app.py CHANGED Viewed

@@ -209,7 +209,16 @@ async def step(
                 state.task_id,
                 float(normalized),
             )
-        return result.model_dump()
     except RuntimeError as exc:
         logger.warning("step runtime error: session_id=%s detail=%s", session_id, str(exc))
         raise HTTPException(status_code=400, detail=str(exc))
@@ -220,12 +229,16 @@ async def step(
 @app.get("/state")
 async def state(x_session_id: Optional[str] = Header(default="default")) -> Dict[str, Any]:
-    env = get_or_create_session(_safe_session_id(x_session_id))
-    try:
-        s = env.state()
-        return s.model_dump()
-    except RuntimeError as exc:
-        raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/tasks")
@@ -318,11 +331,10 @@ async def grader(x_session_id: Optional[str] = Header(default="default")) -> Dic
             "episode_id": s.episode_id,
             "task_id": s.task_id,
             "done": s.done,
-            "cumulative_reward": s.cumulative_reward,
             "step_count": s.step_count,
             "max_steps": s.max_steps,
             "normalized_score": normalized_score,
-            "actions": s.actions_taken,
         }
     except RuntimeError as exc:
         raise HTTPException(status_code=400, detail=str(exc))

                 state.task_id,
                 float(normalized),
             )
+        payload = result.model_dump()
+        info = payload.get("info")
+        if isinstance(info, dict):
+          session_state = env.state()
+          info["cumulative_reward"] = _clamp_open_score(
+            session_state.cumulative_reward / session_state.step_count
+            if session_state.step_count > 0
+            else _SCORE_EPS
+          )
+        return payload
     except RuntimeError as exc:
         logger.warning("step runtime error: session_id=%s detail=%s", session_id, str(exc))
         raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/state")
 async def state(x_session_id: Optional[str] = Header(default="default")) -> Dict[str, Any]:
+  env = get_or_create_session(_safe_session_id(x_session_id))
+  try:
+    s = env.state()
+    payload = s.model_dump()
+    payload["cumulative_reward"] = _clamp_open_score(
+      s.cumulative_reward / s.step_count if s.step_count > 0 else _SCORE_EPS
+    )
+    return payload
+  except RuntimeError as exc:
+    raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/tasks")
             "episode_id": s.episode_id,
             "task_id": s.task_id,
             "done": s.done,
+          "cumulative_reward": normalized_score,
             "step_count": s.step_count,
             "max_steps": s.max_steps,
             "normalized_score": normalized_score,
         }
     except RuntimeError as exc:
         raise HTTPException(status_code=400, detail=str(exc))

clinical-trial-triage/server/openenv_env.py CHANGED Viewed

@@ -30,6 +30,13 @@ from models import (
 from server.environment import ClinicalTrialEnvironment
 class OpenEnvTriageAction(Action):
     """OpenEnv action wrapper for the clinical triage tasks."""
@@ -177,13 +184,16 @@ class ClinicalTrialOpenEnv(
     @property
     def state(self) -> OpenEnvTriageState:
         state = self._core.state()
         return OpenEnvTriageState(
             episode_id=state.episode_id,
             step_count=state.step_count,
             task_id=TaskID(state.task_id),
             max_steps=state.max_steps,
             done=state.done,
-            cumulative_reward=state.cumulative_reward,
             current_case_id=state.current_case_id,
         )

 from server.environment import ClinicalTrialEnvironment
+_SCORE_EPS = 1e-3
+def _clamp_open_score(value: float) -> float:
+    return max(_SCORE_EPS, min(1.0 - _SCORE_EPS, float(value)))
 class OpenEnvTriageAction(Action):
     """OpenEnv action wrapper for the clinical triage tasks."""
     @property
     def state(self) -> OpenEnvTriageState:
         state = self._core.state()
+        normalized_cumulative = _clamp_open_score(
+            state.cumulative_reward / state.step_count if state.step_count > 0 else _SCORE_EPS
+        )
         return OpenEnvTriageState(
             episode_id=state.episode_id,
             step_count=state.step_count,
             task_id=TaskID(state.task_id),
             max_steps=state.max_steps,
             done=state.done,
+            cumulative_reward=normalized_cumulative,
             current_case_id=state.current_case_id,
         )

server/app.py CHANGED Viewed

@@ -209,7 +209,16 @@ async def step(
                 state.task_id,
                 float(normalized),
             )
-        return result.model_dump()
     except RuntimeError as exc:
         logger.warning("step runtime error: session_id=%s detail=%s", session_id, str(exc))
         raise HTTPException(status_code=400, detail=str(exc))
@@ -220,12 +229,16 @@ async def step(
 @app.get("/state")
 async def state(x_session_id: Optional[str] = Header(default="default")) -> Dict[str, Any]:
-    env = get_or_create_session(_safe_session_id(x_session_id))
-    try:
-        s = env.state()
-        return s.model_dump()
-    except RuntimeError as exc:
-        raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/tasks")
@@ -318,11 +331,10 @@ async def grader(x_session_id: Optional[str] = Header(default="default")) -> Dic
             "episode_id": s.episode_id,
             "task_id": s.task_id,
             "done": s.done,
-            "cumulative_reward": s.cumulative_reward,
             "step_count": s.step_count,
             "max_steps": s.max_steps,
             "normalized_score": normalized_score,
-            "actions": s.actions_taken,
         }
     except RuntimeError as exc:
         raise HTTPException(status_code=400, detail=str(exc))

                 state.task_id,
                 float(normalized),
             )
+        payload = result.model_dump()
+        info = payload.get("info")
+        if isinstance(info, dict):
+          session_state = env.state()
+          info["cumulative_reward"] = _clamp_open_score(
+            session_state.cumulative_reward / session_state.step_count
+            if session_state.step_count > 0
+            else _SCORE_EPS
+          )
+        return payload
     except RuntimeError as exc:
         logger.warning("step runtime error: session_id=%s detail=%s", session_id, str(exc))
         raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/state")
 async def state(x_session_id: Optional[str] = Header(default="default")) -> Dict[str, Any]:
+  env = get_or_create_session(_safe_session_id(x_session_id))
+  try:
+    s = env.state()
+    payload = s.model_dump()
+    payload["cumulative_reward"] = _clamp_open_score(
+      s.cumulative_reward / s.step_count if s.step_count > 0 else _SCORE_EPS
+    )
+    return payload
+  except RuntimeError as exc:
+    raise HTTPException(status_code=400, detail=str(exc))
 @app.get("/tasks")
             "episode_id": s.episode_id,
             "task_id": s.task_id,
             "done": s.done,
+          "cumulative_reward": normalized_score,
             "step_count": s.step_count,
             "max_steps": s.max_steps,
             "normalized_score": normalized_score,
         }
     except RuntimeError as exc:
         raise HTTPException(status_code=400, detail=str(exc))

server/openenv_env.py CHANGED Viewed

@@ -30,6 +30,13 @@ from models import (
 from server.environment import ClinicalTrialEnvironment
 class OpenEnvTriageAction(Action):
     """OpenEnv action wrapper for the clinical triage tasks."""
@@ -177,13 +184,16 @@ class ClinicalTrialOpenEnv(
     @property
     def state(self) -> OpenEnvTriageState:
         state = self._core.state()
         return OpenEnvTriageState(
             episode_id=state.episode_id,
             step_count=state.step_count,
             task_id=TaskID(state.task_id),
             max_steps=state.max_steps,
             done=state.done,
-            cumulative_reward=state.cumulative_reward,
             current_case_id=state.current_case_id,
         )

 from server.environment import ClinicalTrialEnvironment
+_SCORE_EPS = 1e-3
+def _clamp_open_score(value: float) -> float:
+    return max(_SCORE_EPS, min(1.0 - _SCORE_EPS, float(value)))
 class OpenEnvTriageAction(Action):
     """OpenEnv action wrapper for the clinical triage tasks."""
     @property
     def state(self) -> OpenEnvTriageState:
         state = self._core.state()
+        normalized_cumulative = _clamp_open_score(
+            state.cumulative_reward / state.step_count if state.step_count > 0 else _SCORE_EPS
+        )
         return OpenEnvTriageState(
             episode_id=state.episode_id,
             step_count=state.step_count,
             task_id=TaskID(state.task_id),
             max_steps=state.max_steps,
             done=state.done,
+            cumulative_reward=normalized_cumulative,
             current_case_id=state.current_case_id,
         )