Spaces:

garvitsachdeva
/

911

Sleeping

App Files Files Community

SayedZahur786 commited on Apr 7

Commit

3c855d7

1 Parent(s): 15a5d1d

fix: revert inference format and make /reset payload optional

Browse files

Files changed (3) hide show

inference.py +7 -21
src/server/app.py +3 -1
tests/test_inference.py +13 -19

inference.py CHANGED Viewed

@@ -36,33 +36,19 @@ TASK_MAX_STEPS: dict[str, int] = {
 # ---------------------------------------------------------------------------
 def log_start(task: str, env: str, model: str):
-    print(json.dumps({
-        "type": "START",
-        "task": task,
-        "env": env,
-        "model": model
-    }), flush=True)
 def log_step(step: int, action, reward: float, done: bool, error=None):
-    print(json.dumps({
-        "type": "STEP",
-        "step": step,
-        "action": str(action),
-        "reward": reward,
-        "done": done,
-        "error": str(error) if error else None
-    }), flush=True)
 def log_end(success: bool, steps: int, score: float, rewards: list):
-    print(json.dumps({
-        "type": "END",
-        "success": success,
-        "steps": steps,
-        "score": score,
-        "rewards": rewards
-    }), flush=True)
 # ---------------------------------------------------------------------------

 # ---------------------------------------------------------------------------
 def log_start(task: str, env: str, model: str):
+    print(f"[START] task={task} env={env} model={model}", flush=True)
 def log_step(step: int, action, reward: float, done: bool, error=None):
+    done_str = "true" if done else "false"
+    err_str = "null" if error is None else str(error)
+    print(f"[STEP] step={step} action={action} reward={reward:.2f} done={done_str} error={err_str}", flush=True)
 def log_end(success: bool, steps: int, score: float, rewards: list):
+    success_str = "true" if success else "false"
+    rewards_str = ",".join(f"{r:.2f}" for r in rewards)
+    print(f"[END] success={success_str} steps={steps} score={score:.2f} rewards={rewards_str}", flush=True)
 # ---------------------------------------------------------------------------

src/server/app.py CHANGED Viewed

@@ -157,7 +157,9 @@ async def list_tasks() -> list[dict[str, str]]:
 @app.post("/reset")
-async def reset(request: ResetRequest) -> dict[str, Any]:
     global _env
     _env = OpenEnvEnvironment(task_id=request.task_id, seed=request.seed)
     obs = await _env.reset()

 @app.post("/reset")
+async def reset(request: ResetRequest | None = None) -> dict[str, Any]:
+    if request is None:
+        request = ResetRequest()
     global _env
     _env = OpenEnvEnvironment(task_id=request.task_id, seed=request.seed)
     obs = await _env.reset()

tests/test_inference.py CHANGED Viewed

@@ -36,13 +36,10 @@ class TestInferenceFormatCompliance:
         assert returncode == 0, f"inference.py failed: {stderr}"
         tasks_run = []
         for line in stdout.split("\n"):
-            if '"type": "START"' in line:
-                try:
-                    import json
-                    d = json.loads(line)
-                    tasks_run.append(d.get("task"))
-                except:
-                    pass
         assert tasks_run == self.TASK_IDS
     def test_start_line_format(self) -> None:
@@ -53,13 +50,10 @@ class TestInferenceFormatCompliance:
             "USE_RANDOM": "true",
         }
         _, stdout, _ = self._run_inference_capture(env)
         for line in stdout.split("\n"):
-            if '"type": "START"' in line:
-                import json
-                d = json.loads(line)
-                assert d.get("task") in self.TASK_IDS
-                assert d.get("env") == "citywide-dispatch-supervisor"
-                assert d.get("model") == "test-model"
     def test_step_line_error_format(self) -> None:
         env = {
@@ -69,12 +63,13 @@ class TestInferenceFormatCompliance:
             "USE_RANDOM": "true",
         }
         _, stdout, _ = self._run_inference_capture(env)
-        valid_errors = {None, "max_steps_exceeded", "illegal_transition", "step_error"}
         for line in stdout.split("\n"):
-            if '"type": "STEP"' in line:
-                import json
-                d = json.loads(line)
-                assert d.get("error") in valid_errors or isinstance(d.get("error"), str)
 class TestEnvVarValidation:
@@ -84,7 +79,6 @@ class TestEnvVarValidation:
         merged_env.update(env)
         # Ensure tests are not affected by host environment variables.
-        # If the test doesn't provide a required var, explicitly remove it.
         if "API_BASE_URL" not in env:
             merged_env.pop("API_BASE_URL", None)
         if "MODEL_NAME" not in env:

         assert returncode == 0, f"inference.py failed: {stderr}"
         tasks_run = []
         for line in stdout.split("\n"):
+            if line.startswith("[START]"):
+                match = re.match(r"\[START\] task=(\S+) env=(\S+) model=(\S+)", line)
+                assert match
+                tasks_run.append(match.group(1))
         assert tasks_run == self.TASK_IDS
     def test_start_line_format(self) -> None:
             "USE_RANDOM": "true",
         }
         _, stdout, _ = self._run_inference_capture(env)
+        pattern = r"\[START\] task=\S+ env=citywide-dispatch-supervisor model=\S+"
         for line in stdout.split("\n"):
+            if line.startswith("[START]"):
+                assert re.match(pattern, line)
     def test_step_line_error_format(self) -> None:
         env = {
             "USE_RANDOM": "true",
         }
         _, stdout, _ = self._run_inference_capture(env)
+        valid_errors = {"null", "max_steps_exceeded", "illegal_transition", "step_error"}
         for line in stdout.split("\n"):
+            if not line.startswith("[STEP]"):
+                continue
+            match = re.match(r"\[STEP\].+ error=(.+)", line)
+            assert match
+            assert match.group(1) in valid_errors
 class TestEnvVarValidation:
         merged_env.update(env)
         # Ensure tests are not affected by host environment variables.
         if "API_BASE_URL" not in env:
             merged_env.pop("API_BASE_URL", None)
         if "MODEL_NAME" not in env: