Spaces:

DevikaJ2005
/

fraudshield-1

Sleeping

App Files Files Community

fraudshield-1 / inference.py

DevikaJ2005

Update agent selection for HF-hosted and local LLM paths

eaf73e8 24 days ago

raw

history blame contribute delete

8.51 kB

	#!/usr/bin/env python3
	"""Competition inference for the FraudShield investigation environment."""

	from __future__ import annotations

	import json
	import logging
	import os
	import sys
	from typing import Dict, List, Tuple

	from fraudshield_env import FraudShieldEnvironment
	from graders import FraudShieldGrader
	from llm_agent import SnapshotCalibratedFraudDetectionAgent, build_default_agent

	logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
	logger = logging.getLogger(__name__)

	RESULTS_FILE = "fraudshield_baseline_results.json"


	def get_env(*names: str, default: str = "") -> str:
	"""Return the first non-empty environment variable from a list of aliases."""

	for name in names:
	value = os.getenv(name)
	if value is not None:
	stripped = value.strip()
	if stripped:
	return stripped
	return default


	def emit_event(event_name: str, **fields: object) -> None:
	"""Print validator-friendly structured progress blocks to stdout."""

	parts = [f"[{event_name}]"]
	parts.extend(f"{key}={value}" for key, value in fields.items())
	print(" ".join(parts), flush=True)


	def build_resilient_agent() -> Tuple[object, object]:
	"""Prefer the configured agent but keep a clean heuristic fallback."""

	heuristic = SnapshotCalibratedFraudDetectionAgent()
	try:
	return build_default_agent(), heuristic
	except Exception as exc:
	logger.warning("Agent initialization failed: %s. Falling back to heuristic baseline.", exc)
	return heuristic, heuristic


	def run_task(
	env: FraudShieldEnvironment,
	agent: object,
	fallback_agent: SnapshotCalibratedFraudDetectionAgent,
	task_name: str,
	) -> Tuple[Dict[str, object], object, List[Dict[str, object]], List[Dict[str, object]], bool]:
	"""Run a full workflow episode for one task."""

	configured_agent = agent
	agent_name = getattr(agent, "name", agent.__class__.__name__)
	emit_event("START", task=task_name, agent=agent_name)
	logger.info("START %s %s", task_name.upper(), agent_name)

	observation = env.reset(task_name).observation
	action_trace: List[Dict[str, object]] = []
	final_decisions: List[Dict[str, object]] = []
	fallback_triggered = False

	while not env.is_done:
	try:
	action = agent.decide(observation)
	except Exception as exc:
	fallback_triggered = True
	logger.warning(
	"Agent decision failed on task %s at step %s: %s. Switching to heuristic fallback.",
	task_name,
	env.step_count + 1,
	exc,
	)
	agent = fallback_agent
	action = agent.decide(observation)

	step_result = env.step(action)
	trace_event = {
	"step": env.step_count,
	"case_id": action.case_id,
	"action_type": action.action_type.value,
	"reasoning": action.reasoning,
	"reward": step_result.reward.value,
	"done": step_result.done,
	}
	if action.note_text:
	trace_event["note_text"] = action.note_text
	if action.resolution is not None:
	trace_event["resolution"] = action.resolution.value
	final_decisions.append(
	{
	"step": env.step_count,
	"case_id": action.case_id,
	"resolution": action.resolution.value,
	"reasoning": action.reasoning,
	"reward": step_result.reward.value,
	}
	)
	action_trace.append(trace_event)

	emit_fields = {
	"task": task_name,
	"step": env.step_count,
	"action": action.action_type.value,
	"case_id": action.case_id,
	"reward": f"{step_result.reward.value:+.2f}",
	}
	if action.resolution is not None:
	emit_fields["resolution"] = action.resolution.value
	emit_event("STEP", **emit_fields)
	logger.info(
	"STEP %02d %s %s %+.2f",
	env.step_count,
	action.action_type.value,
	action.case_id,
	step_result.reward.value,
	)
	observation = step_result.observation

	summary = env.get_episode_report()
	emit_event(
	"END",
	task=task_name,
	steps=summary["step_count"],
	reward=f"{summary['cumulative_reward']:+.3f}",
	accuracy=f"{summary['metrics']['resolution_accuracy']:.3f}",
	)
	logger.info(
	"END %s accuracy=%.3f reward=%.3f",
	task_name.upper(),
	summary["metrics"]["resolution_accuracy"],
	summary["cumulative_reward"],
	)
	summary["configured_agent_name"] = getattr(configured_agent, "name", configured_agent.__class__.__name__)
	summary["effective_agent_name"] = getattr(agent, "name", agent.__class__.__name__)
	return summary, agent, action_trace, final_decisions, fallback_triggered


	def main() -> Dict[str, object]:
	"""Run the configured agent across easy, medium, and hard tasks."""

	logger.info("%s", "=" * 72)
	logger.info("FraudShield baseline inference")
	logger.info("%s", "=" * 72)

	env = FraudShieldEnvironment(data_path="data", seed=42)
	if not env.load_data():
	logger.error("FraudShield data could not be loaded from ./data")
	sys.exit(1)

	agent, fallback_agent = build_resilient_agent()
	configured_agent_name = getattr(agent, "name", agent.__class__.__name__)
	configured_agent_type = getattr(agent, "agent_type", "unknown")
	logger.info(
	"Configured agent: %s (%s) \| API_BASE_URL=%s \| MODEL_NAME=%s \| LOCAL_MODEL_PATH=%s \| HF_TOKEN=%s",
	configured_agent_name,
	configured_agent_type,
	get_env("API_BASE_URL", default="<default>"),
	get_env("MODEL_NAME", default="<unset>"),
	get_env("LOCAL_MODEL_PATH", default="<unset>"),
	"<set>" if get_env("HF_TOKEN", "HUGGINGFACEHUB_API_TOKEN") else "<unset>",
	)

	easy_summary, agent, easy_trace, easy_decisions, easy_fallback = run_task(env, agent, fallback_agent, "easy")
	medium_summary, agent, medium_trace, medium_decisions, medium_fallback = run_task(
	env, agent, fallback_agent, "medium"
	)
	hard_summary, agent, hard_trace, hard_decisions, hard_fallback = run_task(env, agent, fallback_agent, "hard")

	grading_result = FraudShieldGrader.grade_all_tasks(easy_summary, medium_summary, hard_summary)
	grading_result["metadata"] = {
	"configured_agent_name": configured_agent_name,
	"configured_agent_type": configured_agent_type,
	"effective_agent_name": getattr(agent, "name", agent.__class__.__name__),
	"effective_agent_type": getattr(agent, "agent_type", "unknown"),
	"fallback_triggered": easy_fallback or medium_fallback or hard_fallback,
	"api_base_url": get_env("API_BASE_URL"),
	"model_name": get_env("MODEL_NAME", default="gpt-4o-mini"),
	"local_model_path": get_env("LOCAL_MODEL_PATH"),
	"hf_token_present": bool(get_env("HF_TOKEN", "HUGGINGFACEHUB_API_TOKEN")),
	"seed": 42,
	"data_snapshot": env.data_loader.get_bundle_summary(),
	"task_steps": {
	"easy": easy_summary["step_count"],
	"medium": medium_summary["step_count"],
	"hard": hard_summary["step_count"],
	},
	}
	grading_result["episode_summaries"] = {
	"easy": easy_summary,
	"medium": medium_summary,
	"hard": hard_summary,
	}
	grading_result["action_traces"] = {
	"easy": easy_trace,
	"medium": medium_trace,
	"hard": hard_trace,
	}
	grading_result["final_decisions"] = {
	"easy": easy_decisions,
	"medium": medium_decisions,
	"hard": hard_decisions,
	}

	logger.info("Easy score: %.4f", grading_result["easy"]["score"])
	logger.info("Medium score: %.4f", grading_result["medium"]["score"])
	logger.info("Hard score: %.4f", grading_result["hard"]["score"])
	logger.info("Final score: %.4f", grading_result["final_score"])

	with open(RESULTS_FILE, "w", encoding="utf-8") as handle:
	json.dump(grading_result, handle, indent=2)
	logger.info("Saved baseline report to %s", RESULTS_FILE)
	return grading_result


	if __name__ == "__main__":
	try:
	main()
	except Exception as exc:
	logger.exception("Baseline inference failed: %s", exc)
	sys.exit(1)