Spaces:

shon98
/

PyCatan-AI

Configuration error

PyCatan-AI / pycatan /ai /session_analysis.py

shon

b43600a 21 days ago

15.6 kB

	"""
	Utilities for reconstructing an AI decision trace from a logged game session.

	The analyzer intentionally works from files already written by older sessions:
	prompt_N.json, response_N.json, intermediate tool-call responses, optional
	tool follow-up prompts, and tool_executions.json.
	"""

	from __future__ import annotations

	import copy
	import json
	from datetime import datetime
	from pathlib import Path
	from typing import Any, Dict, List, Optional


	def build_decision_analysis(
	source_session: Path,
	decision: Dict[str, Any],
	action_result: Optional[Dict[str, Any]] = None,
	) -> Dict[str, Any]:
	"""Build a human-readable decision trace for one replay decision."""
	session_dir = _resolve_session_for_decision(source_session, decision)
	player_name = str(decision.get("player_name") or "")
	request_number = int(decision.get("request_number") or 0)

	prompt_doc = _load_prompt(session_dir, player_name, request_number)
	response_doc = _load_response(session_dir, player_name, request_number)
	if not isinstance(prompt_doc, dict):
	prompt_doc = {}
	if not isinstance(response_doc, dict):
	response_doc = {}
	parsed = (
	copy.deepcopy(response_doc.get("parsed"))
	if isinstance(response_doc, dict) and isinstance(response_doc.get("parsed"), dict)
	else copy.deepcopy(decision.get("parsed") or {})
	)

	prompt = prompt_doc.get("prompt") if isinstance(prompt_doc, dict) else {}
	if not isinstance(prompt, dict):
	prompt = {}

	tool_trace = _load_tool_trace(session_dir, player_name, request_number)
	memory_before = copy.deepcopy(prompt.get("memory") or {})
	social_context = copy.deepcopy(prompt.get("social_context") or {})
	constraints = copy.deepcopy(prompt.get("constraints") or {})
	allowed_actions = copy.deepcopy(prompt_doc.get("allowed_actions") or constraints.get("allowed_actions") or [])
	compact_state_text = prompt.get("game_state") or ""
	compact_state_json = _extract_embedded_json(compact_state_text)
	observed_facts = _build_observed_facts(
	compact_state_json,
	allowed_actions,
	prompt.get("task_context") or {},
	)

	action_type = parsed.get("action_type") or (parsed.get("action") or {}).get("type")
	action_parameters = parsed.get("parameters")
	if action_parameters is None and isinstance(parsed.get("action"), dict):
	action_parameters = parsed["action"].get("parameters")

	return {
	"available": bool(prompt_doc or response_doc or parsed),
	"session": session_dir.name if session_dir else "",
	"session_path": str(session_dir) if session_dir else "",
	"player_name": player_name,
	"request_number": request_number,
	"timestamp": (
	response_doc.get("timestamp")
	or prompt_doc.get("timestamp")
	or decision.get("timestamp")
	or ""
	),
	"label": f"{player_name} #{request_number}: {action_type or 'decision'}",
	"worldview": {
	"task_context": copy.deepcopy(prompt.get("task_context") or {}),
	"memory_before": memory_before,
	"social_context": social_context,
	"constraints": constraints,
	"compact_game_state": compact_state_text,
	"compact_game_state_json": compact_state_json,
	"observed_facts": observed_facts,
	"allowed_actions": allowed_actions,
	},
	"tool_trace": tool_trace,
	"thinking": parsed.get("internal_thinking") or "",
	"memory_write": parsed.get("note_to_self") or "",
	"say_outloud": parsed.get("say_outloud") or "",
	"action": {
	"type": action_type,
	"parameters": action_parameters,
	},
	"engine_result": copy.deepcopy(action_result or {}),
	"raw": {
	"prompt": prompt_doc,
	"response": response_doc,
	},
	}


	def build_turn_flow(
	source_session: Path,
	decisions: List[Dict[str, Any]],
	) -> List[Dict[str, Any]]:
	"""Build lightweight summaries for every decision in the selected turn."""
	flow: List[Dict[str, Any]] = []
	for item in decisions:
	decision = item.get("decision") or {}
	action_result = item.get("action_result") or {}
	parsed = decision.get("parsed") or {}
	action_type = parsed.get("action_type") or (parsed.get("action") or {}).get("type")
	response_doc = _load_response(
	_resolve_session_for_decision(source_session, decision),
	str(decision.get("player_name") or ""),
	int(decision.get("request_number") or 0),
	)
	if isinstance(response_doc.get("parsed"), dict):
	parsed = response_doc["parsed"]
	action_type = parsed.get("action_type") or (parsed.get("action") or {}).get("type")

	flow.append({
	"snapshot_index": item.get("snapshot_index"),
	"label": item.get("label") or "",
	"player_name": decision.get("player_name") or "",
	"request_number": decision.get("request_number") or 0,
	"action_type": action_type,
	"say_outloud": parsed.get("say_outloud") or "",
	"memory_write": parsed.get("note_to_self") or "",
	"success": action_result.get("success"),
	"message": action_result.get("message") or "",
	"turn_number": action_result.get("turn_number"),
	})
	return flow


	def _load_tool_trace(session_dir: Path, player_name: str, request_number: int) -> List[Dict[str, Any]]:
	intermediate_responses = _load_intermediate_responses(session_dir, player_name, request_number)
	followups = _load_tool_followups(session_dir, player_name, request_number)
	execution_batches = _load_tool_executions(session_dir)
	used_batch_indexes: set[int] = set()
	trace = []

	for intermediate in intermediate_responses:
	iteration = int(intermediate.get("iteration") or 0)
	tool_calls = copy.deepcopy(intermediate.get("tool_calls") or [])
	followup = next((item for item in followups if int(item.get("iteration") or 0) == iteration), {})
	batch_index = _match_tool_execution_batch(
	execution_batches,
	intermediate,
	tool_calls,
	used_batch_indexes,
	)
	batch = execution_batches[batch_index] if batch_index is not None else {}
	if batch_index is not None:
	used_batch_indexes.add(batch_index)

	trace.append({
	"iteration": iteration,
	"timestamp": intermediate.get("timestamp") or followup.get("timestamp") or batch.get("timestamp") or "",
	"tool_calls": tool_calls,
	"tool_results_text": followup.get("tool_results") or _format_batch_results(batch),
	"execution_batch": batch,
	"followup_context_available": bool(followup.get("full_context_sent")),
	"full_context_sent": followup.get("full_context_sent") or "",
	})

	for followup in followups:
	iteration = int(followup.get("iteration") or 0)
	if any(item["iteration"] == iteration for item in trace):
	continue
	trace.append({
	"iteration": iteration,
	"timestamp": followup.get("timestamp") or "",
	"tool_calls": [],
	"tool_results_text": followup.get("tool_results") or "",
	"execution_batch": {},
	"followup_context_available": bool(followup.get("full_context_sent")),
	"full_context_sent": followup.get("full_context_sent") or "",
	})

	trace.sort(key=lambda item: item.get("iteration") or 0)
	return trace


	def _resolve_session_for_decision(source_session: Path, decision: Dict[str, Any]) -> Path:
	source_file = decision.get("source_file")
	if source_file:
	response_path = Path(source_file)
	if response_path.exists():
	return response_path.parent.parent.parent
	return Path(source_session)


	def _player_dir(session_dir: Path, player_name: str) -> Optional[Path]:
	direct = session_dir / player_name
	if direct.exists():
	return direct
	wanted = player_name.lower()
	for child in session_dir.iterdir() if session_dir.exists() else []:
	if child.is_dir() and child.name.lower() == wanted:
	return child
	return None


	def _load_prompt(session_dir: Path, player_name: str, request_number: int) -> Dict[str, Any]:
	player_dir = _player_dir(session_dir, player_name)
	if not player_dir:
	return {}
	return _read_json(player_dir / "prompts" / f"prompt_{request_number}.json")


	def _load_response(session_dir: Path, player_name: str, request_number: int) -> Dict[str, Any]:
	player_dir = _player_dir(session_dir, player_name)
	if not player_dir:
	return {}
	return _read_json(player_dir / "responses" / f"response_{request_number}.json")


	def _load_intermediate_responses(session_dir: Path, player_name: str, request_number: int) -> List[Dict[str, Any]]:
	player_dir = _player_dir(session_dir, player_name)
	if not player_dir:
	return []
	intermediate_dir = player_dir / "responses" / "intermediate"
	items = []
	for path in sorted(intermediate_dir.glob(f"response_{request_number}_iter*.json")):
	data = _read_json(path)
	if data:
	items.append(data)
	return items


	def _load_tool_followups(session_dir: Path, player_name: str, request_number: int) -> List[Dict[str, Any]]:
	player_dir = _player_dir(session_dir, player_name)
	if not player_dir:
	return []
	iterations_dir = player_dir / "prompts" / "iterations"
	items = []
	for path in sorted(iterations_dir.glob(f"prompt_{request_number}_iter*.json")):
	data = _read_json(path)
	if data:
	items.append(data)
	return items


	def _load_tool_executions(session_dir: Path) -> List[Dict[str, Any]]:
	data = _read_json(session_dir / "tool_executions.json")
	return data if isinstance(data, list) else []


	def _match_tool_execution_batch(
	batches: List[Dict[str, Any]],
	intermediate: Dict[str, Any],
	tool_calls: List[Dict[str, Any]],
	used_batch_indexes: set[int],
	) -> Optional[int]:
	expected_names = [str(call.get("name") or "") for call in tool_calls]
	intermediate_ts = _parse_timestamp(intermediate.get("timestamp"))
	best_index = None
	best_delta = None

	for index, batch in enumerate(batches):
	if index in used_batch_indexes:
	continue
	batch_names = [str(call.get("name") or "") for call in batch.get("calls") or []]
	if expected_names and batch_names[: len(expected_names)] != expected_names:
	continue
	batch_ts = _parse_timestamp(batch.get("timestamp"))
	if intermediate_ts and batch_ts and batch_ts < intermediate_ts:
	continue
	delta = (
	(batch_ts - intermediate_ts).total_seconds()
	if intermediate_ts and batch_ts
	else float(index)
	)
	if best_delta is None or delta < best_delta:
	best_delta = delta
	best_index = index

	return best_index


	def _format_batch_results(batch: Dict[str, Any]) -> str:
	calls = batch.get("calls") or []
	if not calls:
	return ""
	lines = ["=== Tool Results ===\n"]
	for call in calls:
	lines.append(f"Tool: {call.get('name', '')}")
	lines.append(f"Parameters: {json.dumps(call.get('parameters') or {}, indent=2, ensure_ascii=False)}")
	if call.get("success", True):
	lines.append("Result:")
	lines.append(json.dumps(call.get("result"), indent=2, ensure_ascii=False))
	else:
	lines.append(f"Error: {call.get('error') or ''}")
	lines.append("---\n")
	return "\n".join(lines)


	def _extract_embedded_json(text: str) -> Optional[Dict[str, Any]]:
	marker = "JSON:"
	if not isinstance(text, str) or marker not in text:
	return None
	candidate = text.split(marker, 1)[1].strip()
	try:
	return json.loads(candidate)
	except Exception:
	return None


	def _build_observed_facts(
	compact_state: Optional[Dict[str, Any]],
	allowed_actions: List[Dict[str, Any]],
	task_context: Dict[str, Any],
	) -> Dict[str, Any]:
	"""Extract the high-signal facts that were visible in compact game_state."""
	if not isinstance(compact_state, dict):
	return {
	"expected_action": _expected_action_from_allowed(allowed_actions),
	"prompt_warnings": _prompt_consistency_warnings(allowed_actions, task_context),
	}

	meta = compact_state.get("meta") or {}
	dice = meta.get("dice")
	dice_total = sum(dice) if isinstance(dice, list) and all(isinstance(x, (int, float)) for x in dice) else None
	current_player = meta.get("curr")
	players = compact_state.get("players") or {}
	current_player_state = (
	copy.deepcopy(players.get(current_player) or {})
	if current_player is not None and isinstance(players, dict)
	else {}
	)

	return {
	"current_player": current_player,
	"phase": meta.get("phase"),
	"robber_hex": meta.get("robber"),
	"dice": dice,
	"dice_total": dice_total,
	"expected_action": _expected_action_from_allowed(allowed_actions),
	"prompt_warnings": _prompt_consistency_warnings(allowed_actions, task_context),
	"current_player_state": current_player_state,
	"players": copy.deepcopy(players) if isinstance(players, dict) else {},
	}


	def _allowed_types(allowed_actions: List[Dict[str, Any]]) -> set[str]:
	result = set()
	for action in allowed_actions or []:
	if isinstance(action, dict):
	value = action.get("type")
	else:
	value = str(action)
	if value:
	result.add(str(value).lower())
	return result


	def _expected_action_from_allowed(allowed_actions: List[Dict[str, Any]]) -> str:
	allowed = _allowed_types(allowed_actions)
	if "roll_dice" in allowed and allowed <= {"roll_dice", "use_dev_card"}:
	if "use_dev_card" in allowed:
	return "Start the turn: roll dice, or optionally use a development card before rolling."
	return "Start the turn: roll dice."
	if {"build_settlement", "build_city", "build_road", "trade_propose", "trade_bank", "buy_dev_card", "end_turn"} & allowed:
	return "Post-roll actions: build, trade, buy/use development card, or end turn."
	if allowed:
	return "Allowed now: " + ", ".join(sorted(allowed))
	return ""


	def _prompt_consistency_warnings(
	allowed_actions: List[Dict[str, Any]],
	task_context: Dict[str, Any],
	) -> List[str]:
	allowed = _allowed_types(allowed_actions)
	what_happened = str((task_context or {}).get("what_just_happened") or "").lower()
	warnings = []
	if "roll_dice" in allowed and allowed <= {"roll_dice", "use_dev_card"}:
	if "build, trade, or end" in what_happened:
	warnings.append(
	"The prompt text says build/trade/end, but the allowed actions show this is a pre-roll decision."
	)
	return warnings


	def _parse_timestamp(value: Any) -> Optional[datetime]:
	if not value:
	return None
	try:
	return datetime.fromisoformat(str(value))
	except Exception:
	return None


	def _read_json(path: Path) -> Any:
	try:
	if path.exists():
	return json.loads(path.read_text(encoding="utf-8"))
	except Exception:
	return {}
	return {}