Spaces:

garvitsachdeva
/

911

Sleeping

App Files Files Community

911 / demo.py

garvitsachdeva

Fix OpenEnv metadata, docker data, tasks endpoint, and demo

e259b96 about 2 months ago

raw

history blame contribute delete

4.9 kB

	#!/usr/bin/env python3
	"""Demo script showing the 911 dispatch supervisor environment in action.

	This non-interactive demo runs an episode using OpenEnvEnvironment directly
	(no LLM/API server required). It uses `legal_actions()` so it is seed/task
	independent.
	"""

	import asyncio
	import sys

	from src.models import Action, DispatchAction
	from src.openenv_environment import OpenEnvEnvironment


	async def run_demo_episode(
	seed: int = 42, task_id: str = "multi_incident", max_steps: int = 120
	) -> dict:
	"""Run a deterministic demo episode."""
	print("=" * 60)
	print("911 DISPATCH SUPERVISOR - DEMO EPISODE")
	print("=" * 60)
	print(f"Task: {task_id}")
	print(f"Seed: {seed}")
	print("-" * 60)

	# Initialize environment
	env = OpenEnvEnvironment(task_id=task_id, seed=seed)

	try:
	# Reset environment
	observation = await env.reset()
	state = env.state()

	print(f"Episode ID: {state.episode_id}")
	print(f"Initial incidents: {len(state.incidents)}")
	print(f"Initial units: {len(state.units)}")
	for inc in sorted(state.incidents.values(), key=lambda i: i.incident_id):
	print(
	f" - {inc.incident_id}: {inc.incident_type.value} {inc.severity.value} ({inc.status.value})"
	)
	print("-" * 60)

	# Track episode progress
	step_count = 0
	total_reward = 0.0
	rewards = []
	errors = []

	# Step through the environment using only legal actions.
	while step_count < max_steps:
	legal = env.legal_actions()
	if not legal:
	break
	action = legal[0]
	step_count += 1
	try:
	obs, reward, done = await env.step(action)
	rewards.append(reward)
	total_reward += reward

	print(
	f"[STEP {step_count}] Action: {action.action_type.value} {action.unit_id}->{action.incident_id} "
	f"Reward: {reward:.4f} Done: {done} Issues: {obs.issues}"
	)

	if done:
	break
	except Exception as e:
	errors.append(f"Step {step_count}: {str(e)}")
	print(f"[STEP {step_count}] ERROR: {e}")
	break

	# Final state
	final_state = env.state()

	# Calculate final score
	final_score = min(1.0, total_reward)

	print("-" * 60)
	print("EPISODE SUMMARY")
	print("-" * 60)
	print(f"Task ID: {task_id}")
	print(f"Episode ID: {final_state.episode_id}")
	print(f"Steps Taken: {step_count}")
	print(f"Total Reward: {total_reward:.4f}")
	print(f"Final Score: {final_score:.4f}")
	print(f"Active incidents: {sum(1 for i in final_state.incidents.values() if i.status.value != 'RESOLVED')}")

	print("\n" + "─" * 60)
	print(f"{'Incident':<12} {'Type':<22} {'Severity':<12} {'Status':<12}")
	print("─" * 60)
	for inc in sorted(final_state.incidents.values(), key=lambda i: i.incident_id):
	print(
	f"{inc.incident_id:<12} {inc.incident_type.value:<22} {inc.severity.value:<12} {inc.status.value:<12}"
	)
	print("─" * 60)

	if errors:
	print(f"\nErrors encountered: {len(errors)}")
	for err in errors:
	print(f" - {err}")
	else:
	print(f"\nErrors: None")

	print("=" * 60)

	return {
	"task_id": task_id,
	"episode_id": final_state.episode_id,
	"steps": step_count,
	"total_reward": total_reward,
	"final_score": final_score,
	"errors": errors,
	}

	finally:
	env.close()


	def main() -> int:
	"""Main entry point for demo script."""
	print("\n")
	print("╔══════════════════════════════════════════════════════════════╗")
	print("║ 911 DISPATCH SUPERVISOR DEMO ║")
	print("║ City-wide emergency dispatch RL environment ║")
	print("╚══════════════════════════════════════════════════════════════╝")
	print("\n")

	try:
	result = asyncio.run(
	run_demo_episode(seed=42, task_id="multi_incident", max_steps=120)
	)

	print("\n[SUCCESS] Demo episode completed successfully!")
	return 0

	except Exception as e:
	print(f"\n[FATAL ERROR] {e}")
	import traceback

	traceback.print_exc()
	return 1


	if __name__ == "__main__":
	sys.exit(main())