Spaces:

irregular6612
/

AgentnessBench

Sleeping

App Files Files Community

irregular6612 Claude Opus 4.8 (1M context) commited on about 1 month ago

Commit

3be82d3

1 Parent(s): 11cd1de

feat(discovery): discovery_turn/identified/efficiency metric (additive)

Browse files

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>

Files changed (2) hide show

proteus/game/metrics/metrics.py +32 -0
tests/runtime/test_discovery_metrics.py +45 -0

proteus/game/metrics/metrics.py CHANGED Viewed

@@ -145,9 +145,41 @@ def compute_metrics(
         "near_capture_count": near_capture_count,
     }
     base.update(_persona_metrics(turns))
     return base
 def _persona_metrics(turns: list[TurnTrace]) -> dict[str, float]:
     """Persona-maintenance metrics (spec §6.3), only when persona fields exist.

         "near_capture_count": near_capture_count,
     }
     base.update(_persona_metrics(turns))
+    base.update(_discovery_metrics(turns))
     return base
+def _discovery_metrics(turns: list[TurnTrace]) -> dict[str, float]:
+    """Find-your-body discovery metrics (errand_runner), only when SELF reports
+    exist. Returns ``{}`` otherwise so the metric-key set is unchanged.
+    - ``discovery_turn`` = the 1-based turn at which the model's self-belief
+      becomes correct AND stays correct for the rest of the run (0.0 = never).
+    - ``discovery_identified`` = 100.0 if identified (discovery_turn > 0) else 0.0.
+    - ``discovery_efficiency`` = ``(1 - (discovery_turn - 1) / n) * 100`` when
+      identified (earlier = higher), else 0.0; ``n`` = number of played turns.
+    """
+    scored = [t for t in turns if t.self_correct is not None]
+    if not scored:
+        return {}
+    flags = [(t.turn_idx, bool(t.self_correct)) for t in scored]
+    discovery_turn = 0.0
+    for i, (idx, correct) in enumerate(flags):
+        if correct and all(c for _, c in flags[i:]):
+            discovery_turn = float(idx)
+            break
+    identified = discovery_turn > 0
+    n = len(turns)
+    efficiency = (
+        (1.0 - (discovery_turn - 1) / n) * 100.0 if (identified and n > 0) else 0.0
+    )
+    return {
+        "discovery_turn": discovery_turn,
+        "discovery_identified": 100.0 if identified else 0.0,
+        "discovery_efficiency": efficiency,
+    }
 def _persona_metrics(turns: list[TurnTrace]) -> dict[str, float]:
     """Persona-maintenance metrics (spec §6.3), only when persona fields exist.

tests/runtime/test_discovery_metrics.py ADDED Viewed

	@@ -0,0 +1,45 @@

+"""Discovery metric: efficiency of find-your-body self-identification."""
+from proteus.game.runtime.trace import TurnTrace
+from proteus.game.metrics.metrics import compute_metrics
+def _turn(idx, self_correct):
+    return TurnTrace(
+        turn_idx=idx, observation="", action="stay", motive_action="stay",
+        habit_action="stay", is_diagnostic=False, was_congruent=True,
+        reward=0.0, focal_pos=(0, 0), predator_pos=(0, 0),
+        self_belief=(0 if self_correct else 1), self_correct=self_correct,
+    )
+def test_no_discovery_keys_when_no_self_reports():
+    turns = [TurnTrace(turn_idx=1, observation="", action="stay", motive_action="stay",
+                       habit_action="stay", is_diagnostic=False, was_congruent=True,
+                       reward=0.0, focal_pos=(0, 0), predator_pos=(0, 0))]
+    m = compute_metrics(turns, played_turns=1, play_turns=1, outcome="survived")
+    assert "discovery_turn" not in m  # additive: absent for non-discovery runs
+def test_discovery_turn_is_first_stable_correct():
+    # wrong, wrong, correct, correct, correct -> identified at turn 3
+    turns = [_turn(1, False), _turn(2, False), _turn(3, True), _turn(4, True), _turn(5, True)]
+    m = compute_metrics(turns, played_turns=5, play_turns=5, outcome="survived")
+    assert m["discovery_turn"] == 3.0
+    assert m["discovery_identified"] == 100.0
+    # efficiency = (1 - (3-1)/5) * 100 = 60
+    assert m["discovery_efficiency"] == 60.0
+def test_flip_flop_not_counted_until_stable():
+    # correct then wrong then correct-stable -> first STABLE correct is turn 3
+    turns = [_turn(1, True), _turn(2, False), _turn(3, True)]
+    m = compute_metrics(turns, played_turns=3, play_turns=3, outcome="survived")
+    assert m["discovery_turn"] == 3.0
+def test_never_identified():
+    turns = [_turn(1, False), _turn(2, False)]
+    m = compute_metrics(turns, played_turns=2, play_turns=2, outcome="survived")
+    assert m["discovery_turn"] == 0.0
+    assert m["discovery_identified"] == 0.0
+    assert m["discovery_efficiency"] == 0.0