Spaces:

garvitsachdeva
/

911

Sleeping

App Files Files Community

garvitsachdeva commited on Apr 6

Commit

4dc3d0a

1 Parent(s): 43f2683

Fix triage reward lookup for enum-qualified metadata

Browse files

Files changed (2) hide show

src/rewards.py +42 -8
tests/test_rewards.py +3 -0

src/rewards.py CHANGED Viewed

@@ -16,6 +16,35 @@ def _clamp01(value: float) -> float:
     return max(0.0, min(1.0, float(value)))
 class RewardSignal(BaseModel):
     """Signal components for reward breakdown."""
@@ -102,17 +131,22 @@ class RewardCalculator:
         if unit is None or incident is None:
             return 0.0
-        required_map = state.metadata.get("default_required_units", {})
-        # Try both formats: plain value and StrEnum repr
-        required_types = (
-            required_map.get(incident.incident_type.value, [])
-            or required_map.get(str(incident.incident_type), [])
-        )
         if not required_types:
             return 0.5
-        # required_types are stored as strings in metadata.
-        if unit.unit_type.value in set(required_types):
             return 1.0
         return 0.0

     return max(0.0, min(1.0, float(value)))
+def _normalize_enumish_key(value: object) -> str:
+    """Normalize keys that may be stored as Enum-ish strings.
+    We accept forms like:
+    - "CARDIAC_ARREST"
+    - "IncidentType.CARDIAC_ARREST"
+    - "src.models.IncidentType.CARDIAC_ARREST"
+    - Enum members (IncidentType.CARDIAC_ARREST)
+    """
+    if isinstance(value, str):
+        text = value
+    else:
+        text = getattr(value, "value", None) or str(value)
+    # If the value looks like a qualified enum name, use the trailing segment.
+    if "." in text:
+        return text.split(".")[-1]
+    return text
+def _normalize_str_list(values: object) -> list[str]:
+    if values is None:
+        return []
+    if not isinstance(values, (list, tuple, set)):
+        return [_normalize_enumish_key(values)]
+    return [_normalize_enumish_key(v) for v in values]
 class RewardSignal(BaseModel):
     """Signal components for reward breakdown."""
         if unit is None or incident is None:
             return 0.0
+        required_map_raw = state.metadata.get("default_required_units", {})
+        if not isinstance(required_map_raw, dict):
+            return 0.5
+        # Normalize metadata so lookups work across serialization styles.
+        required_map: dict[str, list[str]] = {
+            _normalize_enumish_key(k): _normalize_str_list(v) for k, v in required_map_raw.items()
+        }
+        incident_key = _normalize_enumish_key(incident.incident_type)
+        required_types = required_map.get(incident_key, [])
         if not required_types:
             return 0.5
+        # required_types are stored as strings in metadata (often with enum qualifiers).
+        if _normalize_enumish_key(unit.unit_type) in set(required_types):
             return 1.0
         return 0.0

tests/test_rewards.py CHANGED Viewed

@@ -69,6 +69,9 @@ def test_compute_reward_returns_tuple() -> None:
     obs = Observation(result="ok", score=0.8, protocol_ok=True, issues=[])
     signal, total = calc.compute_reward(state, action, obs)
     assert isinstance(signal, RewardSignal)
     assert 0.0 <= total <= 1.0

     obs = Observation(result="ok", score=0.8, protocol_ok=True, issues=[])
     signal, total = calc.compute_reward(state, action, obs)
     assert isinstance(signal, RewardSignal)
+    # Fixture metadata stores enum-ish strings (e.g. "IncidentType.CARDIAC_ARREST").
+    # Triage should still award full credit for a correct match.
+    assert signal.triage == 1.0
     assert 0.0 <= total <= 1.0