Spaces:

Nomos42
/

nba-quant-2

Configuration error

App Files Files Community

nba-quant-2 / evolution /run_logger.py

LBJLincoln

feat: NBA Quant Full Blast — 4 workstreams

34dbefa 24 days ago

raw

history blame contribute delete

18.6 kB

	#!/usr/bin/env python3
	"""
	Run Logger & Auto-Cut — Hedge Fund Grade Evolution Monitoring
	================================================================
	Logs EVERY generation, cycle, and eval to Supabase.
	Auto-cuts evolution when regression detected or stagnation exceeds threshold.

	Tables (auto-created):
	- nba_evolution_runs : one row per cycle (summary)
	- nba_evolution_gens : one row per generation (detailed)
	- nba_evolution_evals : one row per individual evaluation
	- nba_evolution_cuts : log of auto-cut events

	Auto-Cut Rules:
	1. REGRESSION CUT: If best Brier increases by > 0.005 for 3 consecutive gens → rollback
	2. STAGNATION CUT: If no improvement for 20 gens → emergency diversify + log
	3. ROI CUT: If ROI drops below -15% → pause betting, continue evolving
	4. DIVERSITY CUT: If population diversity < 0.05 → inject fresh individuals
	5. FEATURE CUT: If selected features < 40 → expand target_features

	Designed for real-time monitoring via Supabase dashboard or Telegram.
	"""

	import os
	import json
	import time
	from datetime import datetime, timezone
	from pathlib import Path
	from typing import Dict, List, Optional

	# ── Supabase connection ──
	_SUPABASE_URL = os.environ.get("SUPABASE_URL", "")
	_DATABASE_URL = os.environ.get("DATABASE_URL", "")
	_SUPABASE_KEY = os.environ.get("SUPABASE_API_KEY", os.environ.get("SUPABASE_ANON_KEY", ""))

	_pg_pool = None

	def _get_pg():
	"""Lazy PostgreSQL connection pool (Supabase = PostgreSQL)."""
	global _pg_pool
	if _pg_pool is not None:
	return _pg_pool
	# Read at call time, not import time (HF Spaces set env late)
	db_url = os.environ.get("DATABASE_URL", "") or _DATABASE_URL
	if not db_url:
	print(f"[RUN-LOGGER] DATABASE_URL not set — Supabase logging disabled")
	return None
	try:
	import psycopg2
	from psycopg2 import pool as pg_pool
	_pg_pool = pg_pool.SimpleConnectionPool(1, 3, db_url, options="-c search_path=public")
	# Test the connection
	conn = _pg_pool.getconn()
	with conn.cursor() as cur:
	cur.execute("SELECT 1")
	_pg_pool.putconn(conn)
	print(f"[RUN-LOGGER] PostgreSQL connected to Supabase OK")
	return _pg_pool
	except Exception as e:
	print(f"[RUN-LOGGER] PostgreSQL connection failed: {e}")
	_pg_pool = None
	return None


	def _exec_sql(sql, params=None):
	"""Execute SQL on Supabase PostgreSQL. Best-effort, never crashes."""
	pool = _get_pg()
	if not pool:
	return None
	conn = None
	try:
	conn = pool.getconn()
	with conn.cursor() as cur:
	cur.execute(sql, params)
	conn.commit()
	try:
	return cur.fetchall()
	except Exception:
	return True # INSERT/UPDATE succeeded but no rows to fetch
	except Exception as e:
	if conn:
	try:
	conn.rollback()
	except Exception:
	pass
	print(f"[RUN-LOGGER] SQL error: {e}", flush=True)
	return None
	finally:
	if conn and pool:
	try:
	pool.putconn(conn)
	except Exception:
	pass


	def _ensure_tables():
	"""Create logging tables if they don't exist."""
	sqls = [
	"""CREATE TABLE IF NOT EXISTS public.nba_evolution_runs (
	id SERIAL PRIMARY KEY,
	ts TIMESTAMPTZ DEFAULT NOW(),
	cycle INT,
	generation INT,
	best_brier FLOAT,
	best_roi FLOAT,
	best_sharpe FLOAT,
	best_calibration FLOAT,
	best_composite FLOAT,
	best_features INT,
	best_model_type TEXT,
	pop_size INT,
	mutation_rate FLOAT,
	crossover_rate FLOAT,
	stagnation INT,
	games INT,
	feature_candidates INT,
	cycle_duration_s FLOAT,
	avg_composite FLOAT,
	pop_diversity FLOAT,
	top5 JSONB,
	selected_features JSONB
	)""",
	"""CREATE TABLE IF NOT EXISTS public.nba_evolution_gens (
	id SERIAL PRIMARY KEY,
	ts TIMESTAMPTZ DEFAULT NOW(),
	cycle INT,
	generation INT,
	best_brier FLOAT,
	best_roi FLOAT,
	best_sharpe FLOAT,
	best_composite FLOAT,
	n_features INT,
	model_type TEXT,
	mutation_rate FLOAT,
	avg_composite FLOAT,
	pop_diversity FLOAT,
	gen_duration_s FLOAT,
	improved BOOLEAN DEFAULT FALSE
	)""",
	"""CREATE TABLE IF NOT EXISTS public.nba_evolution_cuts (
	id SERIAL PRIMARY KEY,
	ts TIMESTAMPTZ DEFAULT NOW(),
	cut_type TEXT,
	reason TEXT,
	brier_before FLOAT,
	brier_after FLOAT,
	action_taken TEXT,
	params_applied JSONB
	)""",
	"""CREATE TABLE IF NOT EXISTS public.nba_evolution_evals (
	id SERIAL PRIMARY KEY,
	ts TIMESTAMPTZ DEFAULT NOW(),
	generation INT,
	individual_rank INT,
	brier FLOAT,
	roi FLOAT,
	sharpe FLOAT,
	composite FLOAT,
	n_features INT,
	model_type TEXT
	)""",
	]
	for sql in sqls:
	_exec_sql(sql)


	# ── Auto-initialize tables on import ──
	_tables_ready = False


	class RunLogger:
	"""Logs evolution runs to Supabase + local files. Never crashes the main loop."""

	def __init__(self, local_dir=None):
	global _tables_ready
	self.local_dir = Path(local_dir or "/data/run-logs")
	self.local_dir.mkdir(parents=True, exist_ok=True)

	# Auto-cut state
	self.brier_history = [] # last N best Brier values
	self.regression_count = 0 # consecutive regressions
	self.stagnation_count = 0
	self.last_best_brier = 1.0
	self.last_best_composite = 0.0
	self.cuts_applied = 0

	# Ensure Supabase tables exist
	if not _tables_ready:
	_ensure_tables()
	_tables_ready = True
	print("[RUN-LOGGER] Supabase tables ready")

	# ══════════════════════════════════════════
	# LOG — Record events
	# ══════════════════════════════════════════

	def log_generation(self, cycle, generation, best, mutation_rate, avg_composite, pop_diversity, duration_s):
	"""Log one generation result."""
	improved = best["brier"] < self.last_best_brier - 0.0001

	# Supabase
	_exec_sql("""INSERT INTO public.nba_evolution_gens
	(cycle, generation, best_brier, best_roi, best_sharpe, best_composite,
	n_features, model_type, mutation_rate, avg_composite, pop_diversity,
	gen_duration_s, improved)
	VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)""",
	(cycle, generation, best["brier"], best["roi"], best["sharpe"],
	best["composite"], best.get("n_features", 0), best.get("model_type", "?"),
	mutation_rate, avg_composite, pop_diversity, duration_s, improved))

	# Track for auto-cut
	self.brier_history.append(best["brier"])
	if len(self.brier_history) > 50:
	self.brier_history = self.brier_history[-50:]

	return improved

	def log_cycle(self, cycle, generation, best, pop_size, mutation_rate, crossover_rate,
	stagnation, games, feature_candidates, cycle_duration_s,
	avg_composite, pop_diversity, top5=None, selected_features=None):
	"""Log one full cycle (multiple generations) result."""
	_exec_sql("""INSERT INTO public.nba_evolution_runs
	(cycle, generation, best_brier, best_roi, best_sharpe, best_calibration,
	best_composite, best_features, best_model_type, pop_size, mutation_rate,
	crossover_rate, stagnation, games, feature_candidates, cycle_duration_s,
	avg_composite, pop_diversity, top5, selected_features)
	VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)""",
	(cycle, generation, best["brier"], best["roi"], best["sharpe"],
	best.get("calibration", 0), best["composite"], best.get("n_features", 0),
	best.get("model_type", "?"), pop_size, mutation_rate, crossover_rate,
	stagnation, games, feature_candidates, cycle_duration_s,
	avg_composite, pop_diversity,
	json.dumps(top5 or [], default=str),
	json.dumps(selected_features or [], default=str)))

	# Local file backup
	entry = {
	"ts": datetime.now(timezone.utc).isoformat(),
	"cycle": cycle, "generation": generation,
	"best": best, "pop_size": pop_size,
	"mutation_rate": mutation_rate, "stagnation": stagnation,
	}
	log_file = self.local_dir / f"cycle-{cycle:04d}.json"
	log_file.write_text(json.dumps(entry, indent=2, default=str))

	def log_top_evals(self, generation, top_individuals):
	"""Log top 10 individuals for this generation."""
	for rank, ind in enumerate(top_individuals[:10]):
	_exec_sql("""INSERT INTO public.nba_evolution_evals
	(generation, individual_rank, brier, roi, sharpe, composite, n_features, model_type)
	VALUES (%s,%s,%s,%s,%s,%s,%s,%s)""",
	(generation, rank + 1,
	ind.get("brier", ind.get("fitness", {}).get("brier", 0)),
	ind.get("roi", ind.get("fitness", {}).get("roi", 0)),
	ind.get("sharpe", ind.get("fitness", {}).get("sharpe", 0)),
	ind.get("composite", ind.get("fitness", {}).get("composite", 0)),
	ind.get("n_features", 0),
	ind.get("model_type", ind.get("hyperparams", {}).get("model_type", "?"))))

	def log_cut(self, cut_type, reason, brier_before, brier_after, action, params=None):
	"""Log an auto-cut event."""
	_exec_sql("""INSERT INTO public.nba_evolution_cuts
	(cut_type, reason, brier_before, brier_after, action_taken, params_applied)
	VALUES (%s,%s,%s,%s,%s,%s)""",
	(cut_type, reason, brier_before, brier_after, action,
	json.dumps(params or {}, default=str)))
	self.cuts_applied += 1
	print(f"[AUTO-CUT] {cut_type}: {reason} → {action}")

	# ══════════════════════════════════════════
	# AUTO-CUT — Automatic regression/stagnation handling
	# ══════════════════════════════════════════

	def check_auto_cut(self, current_best, engine_state):
	"""
	Check if an auto-cut should be applied.
	Returns: list of actions to take, or empty list.

	Actions are dicts: {"type": "...", "params": {...}}
	The caller (evolution loop) is responsible for executing them.
	"""
	actions = []
	brier = current_best.get("brier", 1.0)
	composite = current_best.get("composite", 0)

	# ── RULE 1: REGRESSION CUT ──
	# If Brier is getting worse for 3+ consecutive generations
	if len(self.brier_history) >= 3:
	last3 = self.brier_history[-3:]
	if all(last3[i] > last3[i-1] + 0.0003 for i in range(1, len(last3))):
	self.regression_count += 1
	if self.regression_count >= 2:
	self.log_cut("REGRESSION", f"Brier increasing 3+ gens: {[f'{b:.4f}' for b in last3]}",
	last3[0], last3[-1], "rollback_mutation",
	{"mutation_rate": max(0.03, engine_state.get("mutation_rate", 0.1) * 0.5)})
	actions.append({
	"type": "config",
	"params": {"mutation_rate": max(0.03, engine_state.get("mutation_rate", 0.1) * 0.5)},
	})
	self.regression_count = 0
	else:
	self.regression_count = 0

	# ── RULE 2: STAGNATION CUT ──
	# At 20+ gens stagnation, diversify moderately (don't destroy good individuals)
	stagnation = engine_state.get("stagnation", 0)
	if stagnation >= 20:
	current_mut = engine_state.get("mutation_rate", 0.04)
	# Boost mutation by 2x (capped at 0.15) — enough to explore without random noise
	new_mut = min(0.15, current_mut * 2)
	self.log_cut("STAGNATION", f"No improvement for {stagnation} gens (mutation {current_mut:.3f} → {new_mut:.3f})",
	brier, brier, "moderate_diversify",
	{"mutation_rate": new_mut})
	actions.append({
	"type": "emergency_diversify",
	"params": {"mutation_rate": new_mut},
	})

	# ── RULE 3: ROI CUT ──
	roi = current_best.get("roi", 0)
	if roi < -0.15:
	self.log_cut("ROI_THRESHOLD", f"ROI dropped to {roi:.1%} — betting paused",
	brier, brier, "pause_betting")
	# Don't stop evolution, just flag for betting logic
	actions.append({"type": "flag", "params": {"pause_betting": True}})

	# ── RULE 4: DIVERSITY CUT ──
	diversity = engine_state.get("pop_diversity", 0)
	if diversity < 3.0 and engine_state.get("pop_size", 0) > 20:
	self.log_cut("DIVERSITY", f"Population diversity {diversity:.1f} too low",
	brier, brier, "inject_random",
	{"inject_count": max(10, engine_state.get("pop_size", 50) // 4)})
	actions.append({
	"type": "inject",
	"params": {"count": max(10, engine_state.get("pop_size", 50) // 4)},
	})

	# ── RULE 5: FEATURE CUT ──
	n_features = current_best.get("n_features", 0)
	if 0 < n_features < 40:
	self.log_cut("LOW_FEATURES", f"Only {n_features} features selected",
	brier, brier, "expand_target",
	{"target_features": 200})
	actions.append({
	"type": "config",
	"params": {"target_features": 200},
	})

	# ── RULE 6: BRIER FLOOR ──
	# If Brier is stuck above 0.24 for 50+ gens, try moderate exploration (NOT full reset)
	# Old rule was destroying progress: mutation 0.25 = random noise, pop 250 > hard cap 80
	if len(self.brier_history) >= 50:
	if all(b > 0.24 for b in self.brier_history[-50:]):
	self.log_cut("BRIER_FLOOR", f"Brier stuck above 0.24 for 50+ gens (best: {min(self.brier_history[-50:]):.4f})",
	brier, brier, "moderate_diversify",
	{"mutation_rate": 0.12, "target_features": 150})
	actions.append({
	"type": "emergency_diversify",
	"params": {"mutation_rate": 0.12, "target_features": 150},
	})
	# Clear history so rule doesn't fire every single generation
	self.brier_history = self.brier_history[-10:]

	# ── RULE 7: LIVE REGRESSION CUT ──
	# If live Brier (from daily eval) is worse than best checkpoint + 0.01 → rollback
	live_brier = engine_state.get("live_brier")
	best_cp_brier = engine_state.get("best_checkpoint_brier")
	if live_brier is not None and best_cp_brier is not None:
	if live_brier > best_cp_brier + 0.01:
	self.log_cut("LIVE_REGRESSION",
	f"Live Brier {live_brier:.4f} > checkpoint {best_cp_brier:.4f} + 0.01",
	best_cp_brier, live_brier, "rollback_to_checkpoint",
	{"target_brier": best_cp_brier})
	actions.append({
	"type": "rollback",
	"params": {"reason": "live_regression", "live_brier": live_brier, "checkpoint_brier": best_cp_brier},
	})

	# Update tracking
	if brier < self.last_best_brier:
	self.last_best_brier = brier
	self.last_best_composite = composite

	return actions

	# ══════════════════════════════════════════
	# QUERY — Read logged data
	# ══════════════════════════════════════════

	def get_recent_runs(self, limit=20):
	"""Get recent cycle logs from Supabase."""
	rows = _exec_sql(
	"SELECT * FROM public.nba_evolution_runs ORDER BY ts DESC LIMIT %s", (limit,))
	return rows or []

	def get_recent_cuts(self, limit=10):
	rows = _exec_sql(
	"SELECT * FROM public.nba_evolution_cuts ORDER BY ts DESC LIMIT %s", (limit,))
	return rows or []

	def get_brier_trend(self, last_n=50):
	rows = _exec_sql(
	"SELECT generation, best_brier FROM public.nba_evolution_gens ORDER BY ts DESC LIMIT %s",
	(last_n,))
	if rows:
	return [(r[0], r[1]) for r in reversed(rows)]
	return self.brier_history[-last_n:]

	def get_stats(self):
	"""Summary stats for dashboard."""
	total_gens = _exec_sql("SELECT COUNT(*) FROM public.nba_evolution_gens")
	total_runs = _exec_sql("SELECT COUNT(*) FROM public.nba_evolution_runs")
	total_cuts = _exec_sql("SELECT COUNT(*) FROM public.nba_evolution_cuts")
	best_ever = _exec_sql(
	"SELECT MIN(best_brier) FROM public.nba_evolution_runs")

	return {
	"total_generations": total_gens[0][0] if total_gens else 0,
	"total_cycles": total_runs[0][0] if total_runs else 0,
	"total_cuts": total_cuts[0][0] if total_cuts else 0,
	"best_brier_ever": best_ever[0][0] if best_ever and best_ever[0][0] else None,
	"local_cuts_applied": self.cuts_applied,
	"regression_count": self.regression_count,
	"brier_history_len": len(self.brier_history),
	}