Spaces:

suvasism2
/

chessecon

Runtime error

App Files Files Community

chessecon / backend /main.py

suvasis

code add

e4d7d50 about 2 months ago

raw

history blame contribute delete

12.3 kB

	"""
	ChessEcon Backend — FastAPI Application
	Serves the chess game API, WebSocket event stream, and the built React frontend.
	"""
	from __future__ import annotations
	import os
	import asyncio
	import json
	import logging
	from pathlib import Path
	from contextlib import asynccontextmanager

	from fastapi import FastAPI, WebSocket, WebSocketDisconnect
	from fastapi.middleware.cors import CORSMiddleware
	from fastapi.staticfiles import StaticFiles
	from fastapi.responses import FileResponse, JSONResponse

	from backend.api.game_router import router as game_router
	from backend.api.training_router import router as training_router
	from backend.api.websocket import ws_manager
	from backend.agents.qwen_agent import QwenAgent
	from backend.agents.grpo_trainer import GRPOTrainer
	from backend.chess_lib.chess_engine import ChessEngine
	from backend.settings import settings

	# ── Logging ───────────────────────────────────────────────────────────────────
	logging.basicConfig(
	level=os.getenv("LOG_LEVEL", "info").upper(),
	format="%(asctime)s [%(levelname)s] %(name)s: %(message)s",
	)
	logger = logging.getLogger(__name__)

	# ── Static frontend path ──────────────────────────────────────────────────────
	FRONTEND_DIST = Path(__file__).parent / "static"

	# ── Live game snapshot (sent to late-joining clients) ────────────────────────
	# Updated by game_loop; read by websocket_endpoint on new connections.
	game_snapshot: dict = {}

	# ── Game loop (runs as a background task) ─────────────────────────────────────
	async def game_loop():
	white = QwenAgent()
	black = QwenAgent()
	from backend.agents.qwen_agent import _load_model
	tokenizer, model = _load_model()
	trainer = GRPOTrainer(model, tokenizer)
	game_num = 0
	# Wallets persist across games — agents earn/lose money each game
	wallet_white = settings.starting_wallet
	wallet_black = settings.starting_wallet

	while True:
	engine = ChessEngine()
	move_history: list[str] = []
	game_num += 1

	# Deduct entry fees at the start of each game
	wallet_white -= settings.entry_fee
	wallet_black -= settings.entry_fee

	# Update snapshot so late-joining clients can sync
	game_snapshot.update({
	"type": "game_start",
	"game_num": game_num,
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	"fen": "rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR w KQkq - 0 1",
	"move_number": 0,
	"grpo_step": 0,
	"games_completed": game_num - 1,
	})

	await ws_manager.broadcast_raw({
	"type": "game_start",
	"data": {
	"game": game_num,
	"game_id": game_num,
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	},
	})

	trainer.start_game("white")

	while not engine.is_game_over:
	color = engine.turn
	agent = white if color == "white" else black

	# get_move returns (san, log_prob)
	san, log_prob = agent.get_move(engine, color, move_history)

	# get reference log prob for GRPO KL term
	ref_log_prob = agent.get_move_log_prob_only(engine, color, move_history, san)

	# apply the move
	uci = engine.apply_move_san(san)
	if uci is None:
	# fallback: random legal move
	san = engine.random_legal_move_san()
	uci = engine.apply_move_san(san) or ""
	log_prob = -1.0
	ref_log_prob = -1.0

	move_history.append(san)
	trainer.record_move(log_prob, ref_log_prob)

	# Keep snapshot current so late joiners see the live position
	game_snapshot.update({
	"fen": engine.fen,
	"move_number": engine.move_number,
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	})

	await ws_manager.broadcast_raw({
	"type": "move",
	"data": {
	"player": color,
	"uci": uci or "",
	"move": san,
	"fen": engine.fen,
	"turn": engine.turn,
	"move_number": engine.move_number,
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	"log_prob": log_prob,
	"message": f"{color} plays {san}",
	},
	})
	await asyncio.sleep(settings.move_delay)

	result = engine.result
	reward_w = engine.compute_reward("white")
	reward_b = engine.compute_reward("black")

	# Award prize money: winner gets 2x entry fee, draw splits the pot
	prize_pool = settings.entry_fee * 2
	if reward_w > 0: # white wins
	prize_white = prize_pool
	prize_black = 0.0
	elif reward_b > 0: # black wins
	prize_white = 0.0
	prize_black = prize_pool
	else: # draw — split pot
	prize_white = prize_pool / 2
	prize_black = prize_pool / 2

	wallet_white += prize_white
	wallet_black += prize_black

	metrics = trainer.end_game(
	reward=reward_w,
	profit=prize_white - settings.entry_fee,
	coaching_calls=0,
	)

	net_pnl_white = prize_white - settings.entry_fee

	# Update snapshot with post-game wallet values
	game_snapshot.update({
	"type": "between_games",
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	"games_completed": game_num,
	"grpo_step": (metrics or trainer._metrics).step,
	})

	await ws_manager.broadcast_raw({
	"type": "game_end",
	"data": {
	"game": game_num,
	"game_id": game_num,
	"result": result,
	"reward": reward_w,
	"reward_white": reward_w,
	"reward_black": reward_b,
	"wallet_white": wallet_white,
	"wallet_black": wallet_black,
	"net_pnl_white": net_pnl_white,
	"prize_income": prize_white,
	"coaching_cost": 0.0,
	"entry_fee": settings.entry_fee,
	"grpo_loss": metrics.loss if metrics else None,
	"win_rate": metrics.win_rate if metrics else None,
	"kl_divergence": metrics.kl_div if metrics else None,
	"avg_profit": metrics.avg_profit if metrics else None,
	"grpo_step": metrics.step if metrics else 0,
	},
	})

	# Always emit a training_step event so the GRPO charts update
	# even when end_game returns None (not every game triggers an update)
	current_metrics = metrics or trainer._metrics
	await ws_manager.broadcast_raw({
	"type": "training_step",
	"data": {
	"step": current_metrics.step,
	"loss": current_metrics.loss,
	"reward": reward_w,
	"kl_div": current_metrics.kl_div,
	"win_rate": current_metrics.win_rate,
	"avg_profit": current_metrics.avg_profit,
	"coaching_rate": 0.0,
	"games": current_metrics.games,
	},
	})

	await asyncio.sleep(settings.move_delay * 4)


	@asynccontextmanager
	async def lifespan(app: FastAPI):
	logger.info("ChessEcon backend starting up")
	logger.info(f"Frontend dist: {FRONTEND_DIST} (exists: {FRONTEND_DIST.exists()})")
	logger.info(f"Claude Coach: {'enabled' if os.getenv('ANTHROPIC_API_KEY') else 'disabled (no API key)'}")
	logger.info(f"HuggingFace token: {'set' if os.getenv('HF_TOKEN') else 'not set'}")
	asyncio.create_task(game_loop())
	yield
	logger.info("ChessEcon backend shutting down")

	# ── FastAPI app ───────────────────────────────────────────────────────────────
	app = FastAPI(
	title="ChessEcon API",
	description="Multi-Agent Chess Economy — Backend API",
	version="2.0.0",
	lifespan=lifespan,
	)

	app.add_middleware(
	CORSMiddleware,
	allow_origins=["*"],
	allow_credentials=True,
	allow_methods=["*"],
	allow_headers=["*"],
	)

	# ── API routes ────────────────────────────────────────────────────────────────
	app.include_router(game_router)
	app.include_router(training_router)

	# ── WebSocket endpoint ──────────────────────────────────────────────────────
	@app.websocket("/ws")
	async def websocket_endpoint(ws: WebSocket):
	await ws_manager.connect(ws)
	# Send current game state to the newly connected client
	if game_snapshot:
	snap = game_snapshot.copy()
	await ws.send_text(json.dumps({
	"type": "status",
	"timestamp": __import__('time').time(),
	"data": snap,
	}))
	try:
	while True:
	data = await ws.receive_text()
	try:
	msg = json.loads(data)
	action = msg.get("action")
	if action == "ping":
	await ws.send_text(json.dumps({"type": "pong"}))
	elif action == "start_game":
	pass # game_loop auto-starts from lifespan
	elif action == "stop_game":
	pass # games stop after current game ends
	except json.JSONDecodeError:
	pass
	except WebSocketDisconnect:
	await ws_manager.disconnect(ws)

	# ── Health check ──────────────────────────────────────────────────────────────
	@app.get("/health")
	async def health():
	return {
	"status": "ok",
	"service": "chessecon-backend",
	"version": "2.0.0",
	"ws_connections": ws_manager.connection_count,
	"claude_available": bool(os.getenv("ANTHROPIC_API_KEY")),
	"hf_token_set": bool(os.getenv("HF_TOKEN")),
	}

	@app.get("/api/config")
	async def get_config():
	return {
	"entry_fee": float(os.getenv("ENTRY_FEE", "10.0")),
	"initial_wallet": float(os.getenv("INITIAL_WALLET", "100.0")),
	"coaching_fee": float(os.getenv("COACHING_FEE", "5.0")),
	"player_model": os.getenv("PLAYER_MODEL", "Qwen/Qwen2.5-0.5B-Instruct"),
	"claude_model": os.getenv("CLAUDE_MODEL", "claude-opus-4-5"),
	"claude_available": bool(os.getenv("ANTHROPIC_API_KEY")),
	"rl_method": os.getenv("RL_METHOD", "grpo"),
	}

	# ── Serve React frontend (SPA) ────────────────────────────────────────────────
	if FRONTEND_DIST.exists():
	app.mount("/assets", StaticFiles(directory=str(FRONTEND_DIST / "assets")), name="assets")

	@app.get("/{full_path:path}")
	async def serve_spa(full_path: str):
	index = FRONTEND_DIST / "index.html"
	if index.exists():
	return FileResponse(str(index))
	return JSONResponse({"error": "Frontend not built"}, status_code=503)
	else:
	@app.get("/")
	async def root():
	return {
	"message": "ChessEcon API running. Frontend not built yet.",
	"docs": "/docs",
	"health": "/health",
	}
	# Patch already applied — see websocket_endpoint above