Spaces:

Vittal-M
/

Disruption-System

Sleeping

App Files Files Community

Disruption-System / scripts /run_preset_benchmark.py

Vittal-M

Upload 66 files

906e104 verified about 1 month ago

raw

history blame contribute delete

9.15 kB

	#!/usr/bin/env python3
	"""
	scripts/run_preset_benchmark.py — Per-preset 3-arm benchmark.

	For each preset in src/presets.py, run THREE simulations on the preset's seed:
	1. Baseline = preset.favored_heuristic (the home-turf specialist)
	2. DAHS-Priority = priority GBR (single fixed model) (one learned ranker)
	3. Meta-selector = BatchwiseSelector + xgb model (the actual product)

	The 3-arm view honestly addresses No-Free-Lunch:
	- DAHS-Priority is allowed to lose to a hand-tuned specialist on its own preset.
	- The Meta-selector is the actual product — it should match or beat the
	specialist by switching to that heuristic when conditions match.

	Write results/preset_benchmark.json — consumed by the Simulation page's
	"3-arm preset benchmark" panel.

	Usage:
	python scripts/run_preset_benchmark.py
	"""
	from __future__ import annotations

	import json
	import logging
	import sys
	from pathlib import Path
	from typing import Any, Dict, List

	import joblib
	import numpy as np

	ROOT = Path(__file__).parent.parent
	sys.path.insert(0, str(ROOT))

	from src.simulator import WarehouseSimulator
	from src.features import FeatureExtractor
	from src.heuristics import (
	fifo_dispatch, priority_edd_dispatch, critical_ratio_dispatch,
	atc_dispatch, wspt_dispatch, slack_dispatch,
	)
	from src.presets import PRESETS

	logging.basicConfig(level=logging.INFO, format="%(asctime)s %(levelname)s %(message)s")
	logger = logging.getLogger(__name__)

	DISPATCH_FNS = {
	"fifo": fifo_dispatch,
	"priority_edd": priority_edd_dispatch,
	"critical_ratio": critical_ratio_dispatch,
	"atc": atc_dispatch,
	"wspt": wspt_dispatch,
	"slack": slack_dispatch,
	}


	def _make_priority_dispatch(model, fe: FeatureExtractor, sim_ref: list):
	"""Closure: priority-GBR dispatcher that scores jobs per call."""
	def dispatch(jobs, t, zone_id):
	sim = sim_ref[0]
	if not jobs or sim is None:
	return fifo_dispatch(jobs, t, zone_id)
	try:
	state = sim.get_state_snapshot()
	sf = fe.extract_scenario_features(state)
	feats = np.stack([
	np.concatenate([sf, fe.extract_job_features(j, state)])
	for j in jobs
	])
	scores = model.predict(feats)
	return [j for _, j in sorted(zip(scores, jobs),
	key=lambda x: x[0], reverse=True)]
	except Exception as exc:
	logger.warning("priority dispatch fallback (%s)", exc)
	return fifo_dispatch(jobs, t, zone_id)
	return dispatch


	def _preset_kwargs(p) -> Dict[str, Any]:
	return dict(
	base_arrival_rate=p.base_arrival_rate,
	breakdown_prob=p.breakdown_prob,
	batch_arrival_size=p.batch_arrival_size,
	lunch_penalty_factor=p.lunch_penalty_factor,
	job_type_frequencies=p.job_type_frequencies,
	due_date_tightness=p.due_date_tightness,
	processing_time_scale=p.processing_time_scale,
	)


	def _make_meta_dispatch(selector, sim_ref: list):
	"""Closure: BatchwiseSelector dispatcher that re-evaluates state per call."""
	def dispatch(jobs, t, zone_id):
	sim = sim_ref[0]
	if sim is None:
	return fifo_dispatch(jobs, t, zone_id)
	try:
	selector.update_state(sim.get_state_snapshot())
	return selector.dispatch(jobs, t, zone_id)
	except Exception as exc:
	logger.warning("meta dispatch fallback (%s)", exc)
	return fifo_dispatch(jobs, t, zone_id)
	return dispatch


	def run_preset(p, gbr_model, xgb_model) -> Dict[str, Any]:
	"""Run all three arms on one preset and return a row dict."""
	from src.hybrid_scheduler import BatchwiseSelector

	sim_kw = _preset_kwargs(p)

	# ── Arm 1: Baseline (favored heuristic) ─────────────────────────────────
	fe1 = FeatureExtractor()
	base_fn = DISPATCH_FNS.get(p.favored_heuristic, fifo_dispatch)
	base_sim = WarehouseSimulator(seed=p.seed, heuristic_fn=base_fn,
	feature_extractor=fe1, **sim_kw)
	base_metrics = base_sim.run(duration=600.0)

	# ── Arm 2: DAHS-Priority (single fixed GBR) ─────────────────────────────
	fe2 = FeatureExtractor()
	sim_ref2: list = [None]
	dispatch2 = _make_priority_dispatch(gbr_model, fe2, sim_ref2)
	dahs_sim = WarehouseSimulator(seed=p.seed, heuristic_fn=dispatch2,
	feature_extractor=fe2, **sim_kw)
	sim_ref2[0] = dahs_sim
	dahs_metrics = dahs_sim.run(duration=600.0)

	# ── Arm 3: Meta-selector (BatchwiseSelector with xgb) ───────────────────
	fe3 = FeatureExtractor()
	selector = BatchwiseSelector(model=xgb_model, feature_extractor=fe3)
	sim_ref3: list = [None]
	dispatch3 = _make_meta_dispatch(selector, sim_ref3)
	meta_sim = WarehouseSimulator(seed=p.seed, heuristic_fn=dispatch3,
	feature_extractor=fe3, **sim_kw)
	sim_ref3[0] = meta_sim
	meta_metrics = meta_sim.run(duration=600.0)

	base_t = float(base_metrics.total_tardiness)
	dahs_t = float(dahs_metrics.total_tardiness)
	meta_t = float(meta_metrics.total_tardiness)
	dahs_imp = (base_t - dahs_t) / base_t * 100.0 if base_t > 0 else 0.0
	meta_imp = (base_t - meta_t) / base_t * 100.0 if base_t > 0 else 0.0

	# Snapshot which heuristics the meta-selector actually picked
	sw_log = selector.switching_log.entries if selector.switching_log else []
	picks = {}
	for entry in sw_log:
	h = entry.get("selected", "?")
	picks[h] = picks.get(h, 0) + 1
	top_picks = sorted(picks.items(), key=lambda x: x[1], reverse=True)[:3]

	return {
	"preset": p.name,
	"favored": p.favored_heuristic,
	"seed": int(p.seed),
	"baseline_tardiness": round(base_t, 2),
	"dahs_tardiness": round(dahs_t, 2),
	"meta_tardiness": round(meta_t, 2),
	"baseline_sla_breach": round(float(base_metrics.sla_breach_rate), 4),
	"dahs_sla_breach": round(float(dahs_metrics.sla_breach_rate), 4),
	"meta_sla_breach": round(float(meta_metrics.sla_breach_rate), 4),
	"baseline_completed": int(base_metrics.completed_jobs),
	"dahs_completed": int(dahs_metrics.completed_jobs),
	"meta_completed": int(meta_metrics.completed_jobs),
	"improvement_pct": round(dahs_imp, 2), # back-compat: DAHS-Priority vs baseline
	"meta_improvement_pct": round(meta_imp, 2), # meta-selector vs baseline
	"dahs_wins": dahs_t <= base_t,
	"meta_wins": meta_t <= base_t,
	"meta_top_picks": top_picks, # what did the selector actually pick?
	"meta_n_switches": len(sw_log),
	}


	def main() -> None:
	gbr_path = ROOT / "models" / "priority_gbr.joblib"
	xgb_path = ROOT / "models" / "selector_xgb.joblib"
	if not gbr_path.exists():
	raise SystemExit(f"Missing model: {gbr_path}. Run scripts/run_pipeline.py first.")
	if not xgb_path.exists():
	raise SystemExit(f"Missing model: {xgb_path}. Run scripts/run_pipeline.py first.")

	logger.info("Loading priority GBR from %s", gbr_path)
	gbr_model = joblib.load(gbr_path)
	logger.info("Loading selector XGB from %s", xgb_path)
	xgb_model = joblib.load(xgb_path)

	rows: List[Dict[str, Any]] = []
	for p in PRESETS:
	logger.info("Running preset %s (favored=%s, seed=%d)",
	p.name, p.favored_heuristic, p.seed)
	rows.append(run_preset(p, gbr_model, xgb_model))

	out_path = ROOT / "results" / "preset_benchmark.json"
	out_path.parent.mkdir(parents=True, exist_ok=True)
	out_path.write_text(json.dumps(rows, indent=2))
	logger.info("Wrote %s", out_path)

	print("\n" + "=" * 110)
	print(f"{'Preset':<22} {'Favored':<14} {'Baseline':>10} {'DAHS-Pri':>10} {'Meta-sel':>10} "
	f"{'DAHSwin':>8} {'Metawin':>8}")
	print("-" * 110)
	n_dahs = 0
	n_meta = 0
	for r in rows:
	if r["dahs_wins"]: n_dahs += 1
	if r["meta_wins"]: n_meta += 1
	print(f"{r['preset']:<22} {r['favored']:<14} "
	f"{r['baseline_tardiness']:>10.1f} {r['dahs_tardiness']:>10.1f} {r['meta_tardiness']:>10.1f} "
	f"{('YES' if r['dahs_wins'] else 'NO'):>8} {('YES' if r['meta_wins'] else 'NO'):>8}")
	print("=" * 110)
	print(f"DAHS-Priority wins: {n_dahs}/{len(rows)} Meta-selector wins: {n_meta}/{len(rows)}\n")

	print("Meta-selector heuristic picks per preset:")
	for r in rows:
	picks = r.get("meta_top_picks", [])
	picks_str = ", ".join(f"{h}:{n}" for h, n in picks)
	print(f" {r['preset']:<22} switches={r['meta_n_switches']:<3} top_picks=[{picks_str}]")


	if __name__ == "__main__":
	main()