Spaces:

ThejasRao
/

ModPilot

Sleeping

App Files Files Community

ModPilot / api /main.py

ThejasRao

Deploy ModPilot Investigation Engine

7302343 about 1 month ago

Raw

History Blame Contribute Delete

10.4 kB

	"""ModPilot Investigation Engine — FastAPI entry point.

	Spec: docs/Specs.md §10, docs/08-API.md
	"""

	from __future__ import annotations

	from contextlib import asynccontextmanager
	from typing import TYPE_CHECKING

	from fastapi import FastAPI, Request

	from api.config import get_settings
	from api.errors import register_error_handlers
	from api.middleware import CorrelationIdMiddleware, HmacMiddleware
	from api.pipeline import PipelineResult, run_investigation
	from api.schemas import InvestigateRequest, InvestigateResponse
	from observability.logging import configure_logging, get_logger
	from orchestrator.loop import Orchestrator
	from orchestrator.prior_actions import PriorActionsTool
	from orchestrator.report_velocity import ReportVelocityTool
	from orchestrator.thread_context import ThreadContextTool
	from orchestrator.tools import ToolRegistry
	from orchestrator.user_history import UserHistoryTool
	from store.connections import close_postgres, close_redis, open_postgres, open_redis
	from store.postgres import (
	append_evidence,
	ensure_subreddit_profile,
	finalize_investigation,
	get_thread_memory,
	get_user_memory,
	make_sessionmaker,
	start_investigation,
	with_session,
	)
	from store.types import (
	EvidenceRowInput,
	FinalizeInvestigationInput,
	StartInvestigationInput,
	)

	if TYPE_CHECKING:
	from collections.abc import AsyncIterator


	@asynccontextmanager
	async def lifespan(app: FastAPI) -> AsyncIterator[None]:
	settings = get_settings()
	configure_logging(level=settings.log_level, env=settings.env)
	logger = get_logger(__name__)
	settings.validate_for_runtime() # F-0.7 — fail-closed in prod when keys missing
	logger.info(
	"engine.startup",
	env=settings.env,
	model_reasoner=settings.model_reasoner,
	model_summarizer=settings.model_summarizer,
	hmac_enforced=settings.hmac_enforced,
	gemini_configured=bool(settings.gemini_api_key),
	)

	# F-0.6: probe Postgres + Redis at startup.
	app.state.pg = await open_postgres(settings)
	app.state.redis = await open_redis(settings)
	app.state.pg_sessions = make_sessionmaker(app.state.pg)

	# LLM client — deferred import to avoid hard google-genai dep at import time.
	# Built before the registry so LLM-using tools (thread_context) can register.
	if settings.gemini_api_key:
	from llm.gemini import GeminiClient # noqa: PLC0415

	app.state.llm = GeminiClient(settings)
	else:
	app.state.llm = None
	logger.warning("engine.no_llm", reason="GEMINI_API_KEY not set")

	# E-2.11 + I-3.3: build Tool Registry + Orchestrator.
	registry = ToolRegistry()
	registry.register(ReportVelocityTool(app.state.redis))
	registry.register(PriorActionsTool(app.state.pg_sessions))
	registry.register(UserHistoryTool(app.state.pg_sessions))
	if app.state.llm is not None:
	registry.register(ThreadContextTool(app.state.llm, app.state.redis))
	else:
	logger.warning("engine.thread_context_disabled", reason="no LLM client")
	# PolicyMatchTool requires embed + rules_text functions; registered when
	# those are wired (post-MVP). Orchestrator records "skipped" for missing tools.
	app.state.orchestrator = Orchestrator(registry)

	try:
	yield
	finally:
	await close_redis(app.state.redis)
	await close_postgres(app.state.pg)
	logger.info("engine.shutdown")


	app = FastAPI(
	title="ModPilot Investigation Engine",
	version="0.0.1",
	description="Context-aware investigation engine for Reddit moderation",
	lifespan=lifespan,
	)

	# Middleware order matters: HMAC runs after correlation-id is bound,
	# so a rejection log carries the request's correlation_id.
	app.add_middleware(HmacMiddleware)
	app.add_middleware(CorrelationIdMiddleware)

	register_error_handlers(app)


	@app.get("/health")
	async def health() -> dict[str, object]:
	"""Liveness + readiness + model identifiers. Spec: docs/Specs.md §10.1."""
	settings = get_settings()
	return {
	"ok": True,
	"data": {
	"engine": "0.0.1",
	"git_sha": "unknown",
	"reasoner_prompt": None,
	"summarizer_prompt": None,
	"model_reasoner": settings.model_reasoner,
	"model_summarizer": settings.model_summarizer,
	},
	}


	@app.post("/investigate", response_model=InvestigateResponse)
	async def investigate(
	req: InvestigateRequest, request: Request
	) -> InvestigateResponse:
	"""Full pipeline: Strategy -> Orchestrator -> Reasoner -> Validator -> Calibrator.

	Persists investigation + evidence rows. Returns verdict.
	Spec: docs/Specs.md §10.2, docs/04-InvestigationEngine.md §1-§9.
	"""
	logger = get_logger(__name__).bind(correlation_id=req.correlation_id)
	logger.info(
	"investigation.requested",
	subreddit_id=req.subreddit_id,
	target_kind=req.target.kind,
	target_id=req.target.id,
	reporter_count=req.report.reporter_count,
	)

	orchestrator: Orchestrator = request.app.state.orchestrator
	llm = request.app.state.llm

	# Fetch subreddit + memory context from DB (cold-start defaults if missing).
	personality = "balanced"
	region = "Global"
	rules = ""
	cold_start = True
	user_risk_tier = "new"
	tier_override = "auto"
	thread_escalated = False

	# I-3.9: pull subreddit_profile + user_memory + thread_memory in a
	# single session so the Strategy Selector inputs reflect cached state.
	# Lazily create the subreddit_profile row on first contact — the engine
	# doesn't yet receive onAppInstall (post-MVP), so production traffic
	# would otherwise FK-violate on investigation insert.
	async with with_session(request.app.state.pg_sessions) as session:
	profile = await ensure_subreddit_profile(
	session,
	subreddit_id=req.subreddit_id,
	name=req.subreddit_id, # name unknown engine-side until AppInstall relay; safe default
	)
	if profile is not None:
	personality = profile.personality
	region = profile.region
	rules = profile.rules
	cold_start = profile.cold_start_count < 50
	tier_override = profile.tier_override

	if req.target.author:
	user_mem = await get_user_memory(
	session, subreddit_id=req.subreddit_id, user_id=req.target.author
	)
	if user_mem is not None:
	user_risk_tier = user_mem.risk_tier

	if req.context.thread_id:
	thread_mem = await get_thread_memory(
	session, subreddit_id=req.subreddit_id, post_id=req.context.thread_id
	)
	if thread_mem is not None:
	# Escalation cached when prior mod attention exists OR a
	# prior thread_context summary recorded escalation.
	escalation_turn = thread_mem.detail.get("escalation_turn")
	thread_escalated = bool(thread_mem.mod_actions_taken) or (
	escalation_turn is not None
	)

	# Run the pipeline.
	result = await run_investigation(
	req=req,
	orchestrator=orchestrator,
	llm=llm,
	personality=personality,
	region=region,
	rules=rules,
	cold_start=cold_start,
	user_risk_tier=user_risk_tier,
	velocity_zscore=0.0, # TODO(E-3.x): precompute from Redis before pipeline
	rule_match_score=0.0, # TODO(E-3.x): precompute from embeddings before pipeline
	tier_override=tier_override,
	thread_escalated=thread_escalated,
	)

	# Persist investigation + evidence rows.
	await _persist(request, req, result)

	return InvestigateResponse(data=result.verdict)


	async def _persist(
	request: Request,
	req: InvestigateRequest,
	result: PipelineResult,
	) -> None:
	"""Write investigation + evidence + verdict to Postgres."""
	async with with_session(request.app.state.pg_sessions) as session:
	inv = await start_investigation(
	session,
	input_=StartInvestigationInput(
	correlation_id=req.correlation_id,
	subreddit_id=req.subreddit_id,
	target_kind=req.target.kind,
	target_id=req.target.id,
	target_body=req.target.body,
	target_author_id=req.target.author,
	tier=result.tier,
	),
	)

	for entry in result.accumulator.entries():
	await append_evidence(
	session,
	investigation=inv,
	subreddit_id=req.subreddit_id,
	evidence=EvidenceRowInput(
	evidence_id=entry.id,
	tool=entry.tool,
	summary=entry.summary,
	detail=entry.detail,
	status=entry.status,
	latency_ms=entry.latency_ms,
	),
	)

	v = result.verdict
	await finalize_investigation(
	session,
	correlation_id=req.correlation_id,
	subreddit_id=req.subreddit_id,
	verdict=FinalizeInvestigationInput(
	risk_tier=v.risk_tier,
	recommendation=v.recommendation,
	calibrated_confidence=v.calibrated_confidence,
	rationale=v.rationale,
	confidence_breakdown={
	"llm_self_report": v.confidence_breakdown.llm_self_report,
	"evidence_convergence": v.confidence_breakdown.evidence_convergence,
	"subreddit_accuracy": v.confidence_breakdown.subreddit_accuracy,
	"rule_match_strength": v.confidence_breakdown.rule_match_strength,
	},
	model_reasoner=v.model_reasoner,
	model_summarizer=v.model_summarizer,
	cost_usd=v.cost_usd,
	latency_ms=v.latency_ms,
	input_tokens=result.input_tokens,
	output_tokens=result.output_tokens,
	validation_flag=v.validation_flag,
	degraded=v.degraded,
	cold_start=v.cold_start,
	),
	)


	# TODO(S-1.6): POST /feedback
	# TODO(U-4.7): POST /explain
	# TODO(F-0.7): GET /config/{sub_id}