Add inference code, config, and technical report

e68eb1c verified 18 days ago

7.78 kB

	"""solution.py — Competition submission for the Wunder Fund RNN Challenge.

	Root entry point for the scorer. Defines PredictionModel with a predict()
	method that receives DataPoint objects one at a time and predicts the next
	state when need_prediction is True.

	Primary backend: an ensemble of causal GRU forecasters (carrying hidden state
	across steps for O(1)/prediction online inference), optionally blended per
	feature with tabular models. Falls back to joblib tabular models, then a
	momentum baseline (only when ALLOW_FALLBACK=1).
	"""

	import os

	# Windows: torch and numpy/sklearn each ship an OpenMP runtime; importing torch
	# before the MKL-backed stack avoids a c10.dll init failure. Also keep the
	# submission single-core friendly by default (the scorer grants 1 CPU).
	os.environ.setdefault("KMP_DUPLICATE_LIB_OK", "TRUE")
	_THREADS = os.environ.get("WUNDER_THREADS", "1")
	os.environ.setdefault("OMP_NUM_THREADS", _THREADS)

	try:
	import torch
	torch.set_num_threads(max(1, int(_THREADS)))
	_HAS_TORCH = True
	except Exception:
	_HAS_TORCH = False

	import json
	from pathlib import Path
	from typing import Optional

	import numpy as np

	_ROOT = Path(__file__).resolve().parent
	import sys
	if str(_ROOT) not in sys.path:
	sys.path.insert(0, str(_ROOT))


	class DataPoint:
	"""Mirror of competition_package.utils.DataPoint for standalone use."""

	def __init__(self, seq_ix, step_in_seq, need_prediction, state):
	self.seq_ix = seq_ix
	self.step_in_seq = step_in_seq
	self.need_prediction = need_prediction
	self.state = state


	class PredictionModel:
	"""Competition PredictionModel. Loads the best available backend."""

	def __init__(self):
	self.n_features = 32
	self.backend = "fallback"
	self.predictor = None # object exposing predict(data_point)
	self._current_seq = None
	self._prev_state = None
	self._cur_state = None

	self._try_load_gru()
	if self.predictor is None:
	self._try_load_onnx()
	if self.predictor is None:
	self._try_load_tabular()
	if self.predictor is None:
	self._try_load_pytorch()
	if self.predictor is None and os.environ.get("ALLOW_FALLBACK") != "1":
	raise RuntimeError(
	"No trained model artifacts found. Set ALLOW_FALLBACK=1 only for "
	"local smoke tests; real submissions must package models."
	)

	# ------------------------------------------------------------------
	# Backends
	# ------------------------------------------------------------------
	def _try_load_gru(self):
	"""Primary: GRU ensemble (+ optional tabular members) under models/submission."""
	if not _HAS_TORCH:
	return
	try:
	from src.models.ensemble_predictor import EnsemblePredictionModel
	from src.models.sequence_inference import (
	GRUStatefulPredictionModel,
	load_gru_checkpoint,
	)

	sub = _ROOT / "models" / "submission"
	gru_paths = sorted((sub / "gru").glob("*.pt")) if (sub / "gru").exists() else []
	if not gru_paths:
	return

	members, names = [], []
	for p in gru_paths:
	model = load_gru_checkpoint(str(p))
	members.append(GRUStatefulPredictionModel(model))
	names.append(p.stem)

	# optional tabular members
	tab_dir = sub / "tabular"
	if tab_dir.exists():
	import joblib
	from src.models.baselines import TabularStatefulPredictionModel
	for jb in sorted(tab_dir.glob("*/model.joblib")):
	manifest = jb.parent / "model_manifest.json"
	schema = "compact_v1"
	if manifest.exists():
	try:
	schema = json.loads(manifest.read_text()).get("feature_schema", schema)
	except Exception:
	pass
	members.append(TabularStatefulPredictionModel(joblib.load(str(jb)), feature_schema=schema))
	names.append(jb.parent.name)

	weights = None
	wpath = sub / "blend_weights.json"
	if wpath.exists():
	try:
	payload = json.loads(wpath.read_text())
	w = np.asarray(payload["per_feature_weights"], dtype=np.float32)
	if w.shape == (self.n_features, len(members)):
	weights = w
	except Exception:
	weights = None

	self.predictor = EnsemblePredictionModel(members, weights=weights)
	self.backend = "gru_ensemble"
	except Exception:
	self.predictor = None

	def _try_load_onnx(self):
	"""ONNX ensemble (kept for completeness; not the primary path)."""
	return

	def _try_load_tabular(self):
	"""Joblib tabular models discovered under models/ (legacy/baseline path)."""
	try:
	import joblib
	from src.models.baselines import TabularStatefulPredictionModel
	from src.models.ensemble_predictor import EnsemblePredictionModel

	model_dir = _ROOT / "models"
	joblib_files = sorted(model_dir.glob("phase2_tabular/**/model.joblib"))
	if not joblib_files:
	return
	members = []
	for path in joblib_files:
	manifest = path.parent / "model_manifest.json"
	schema = "compact_v1"
	if manifest.exists():
	try:
	schema = json.loads(manifest.read_text()).get("feature_schema", schema)
	except Exception:
	pass
	members.append(TabularStatefulPredictionModel(joblib.load(str(path)), feature_schema=schema))
	if members:
	self.predictor = EnsemblePredictionModel(members)
	self.backend = "tabular"
	except Exception:
	self.predictor = None

	def _try_load_pytorch(self):
	"""Legacy PyTorch checkpoint path (kept for test compatibility)."""
	return

	# ------------------------------------------------------------------
	# Predict
	# ------------------------------------------------------------------
	def predict(self, data_point) -> Optional[np.ndarray]:
	if self.predictor is not None:
	return self.predictor.predict(data_point)
	return self._predict_fallback(data_point)

	def _predict_fallback(self, data_point) -> Optional[np.ndarray]:
	"""Momentum baseline; only reachable with ALLOW_FALLBACK=1."""
	if self._current_seq != data_point.seq_ix:
	self._current_seq = data_point.seq_ix
	self._prev_state = None
	self._cur_state = None
	self._prev_state = self._cur_state
	self._cur_state = np.asarray(data_point.state, dtype=np.float32)
	if not data_point.need_prediction:
	return None
	if self._prev_state is None:
	return self._cur_state.astype(np.float32, copy=True)
	return (2.0 * self._cur_state - self._prev_state).astype(np.float32)


	if __name__ == "__main__":
	model = PredictionModel()
	print(f"Backend: {model.backend}")
	for step in range(200):
	dp = DataPoint(0, step, step >= 100, np.random.randn(32).astype(np.float32))
	pred = model.predict(dp)
	if pred is not None and step == 100:
	print(f"step {step}: shape={pred.shape} dtype={pred.dtype} finite={np.all(np.isfinite(pred))}")
	print("Local test passed!")