Spaces:

joytheslothh
/

MediRAG-API

Running

App Files Files Community

MediRAG-API / src /api /schemas.py

joytheslothh

deploy: clean build

b6f9fa8 1 day ago

raw

history blame contribute delete

10.1 kB

	"""
	src/api/schemas.py — Pydantic request/response models for MediRAG FastAPI
	=========================================================================
	FR-18: Input validation limits from config.yaml → api:
	- max_query_length: 500
	- max_answer_length: 2000
	- max_chunks: 10
	- max_chunk_length: 2000
	"""
	from __future__ import annotations

	from typing import Any, Dict, List, Optional
	from pydantic import BaseModel, Field, field_validator

	class IngestRequest(BaseModel):
	"""POST /ingest — append a custom document to the FAISS index."""
	title: str = Field(..., description="Document title")
	text: str = Field(..., min_length=10, description="Raw text of the document to ingest")
	pub_type: str = Field(default="clinical_guideline", description="Document type")
	source: str = Field(default="custom_upload", description="Source of the document")


	# ---------------------------------------------------------------------------
	# Request schemas
	# ---------------------------------------------------------------------------

	class ContextChunk(BaseModel):
	"""A single retrieved context chunk passed to the evaluation pipeline."""
	text: str = Field(..., min_length=1, max_length=2000,
	description="Chunk text (max 2000 chars)")
	# Optional metadata fields — all pass-through to the pipeline modules
	chunk_id: Optional[str] = None
	pub_type: Optional[str] = None
	pub_year: Optional[int] = None
	source: Optional[str] = None
	title: Optional[str] = None
	tier_type: Optional[str] = None # pre-labelled evidence tier (optional)
	score: Optional[float] = None # retrieval similarity score


	class EvaluateRequest(BaseModel):
	"""POST /evaluate — request body."""
	question: str = Field(
	...,
	min_length=5,
	max_length=500,
	description="User question (5–500 chars)",
	examples=["What is the recommended dosage of Metformin for Type 2 Diabetes in elderly patients?"],
	)
	answer: str = Field(
	...,
	min_length=1,
	max_length=2000,
	description="LLM-generated answer to evaluate (1–2000 chars)",
	examples=["Metformin is typically started at 500 mg twice daily with meals..."],
	)
	context_chunks: List[ContextChunk] = Field(
	...,
	min_length=1,
	max_length=10,
	description="Retrieved context chunks (1–10 items)",
	)
	run_ragas: bool = Field(
	default=False,
	description="Run RAGAS evaluation (requires Ollama or OpenAI backend; slower)",
	)
	llm_provider: Optional[str] = Field(
	default=None,
	description="LLM provider override: 'gemini' or 'ollama'"
	)
	llm_api_key: Optional[str] = Field(
	default=None,
	description="API Key if accessing Gemini"
	)
	llm_model: Optional[str] = Field(
	default=None,
	description="Specific model string if overriding defaults"
	)
	rxnorm_cache_path: str = Field(
	default="data/rxnorm_cache.csv",
	description="Path to RxNorm cache CSV",
	)

	@field_validator("context_chunks")
	@classmethod
	def at_least_one_chunk(cls, v: list) -> list:
	if len(v) == 0:
	raise ValueError("At least one context chunk is required")
	return v


	# ---------------------------------------------------------------------------
	# Response schemas
	# ---------------------------------------------------------------------------

	class ModuleScore(BaseModel):
	"""Score + details dict for a single evaluation module."""
	score: float = Field(..., ge=0.0, le=1.0, description="Module score in [0, 1]")
	details: Dict[str, Any] = Field(default_factory=dict)
	error: Optional[str] = Field(None, description="Error message if module failed")
	latency_ms: Optional[int] = None


	class ModuleResults(BaseModel):
	"""All per-module scores bundled together."""
	faithfulness: Optional[ModuleScore] = None
	entity_verifier: Optional[ModuleScore] = None
	source_credibility: Optional[ModuleScore] = None
	contradiction: Optional[ModuleScore] = None
	ragas: Optional[ModuleScore] = None


	class EvaluateResponse(BaseModel):
	"""POST /evaluate — response body (FR-17 format)."""
	composite_score: float = Field(
	..., ge=0.0, le=1.0,
	description="Weighted composite score in [0, 1]"
	)
	hrs: int = Field(
	..., ge=0, le=100,
	description="Health Risk Score = round(100 × (1 - composite_score))"
	)
	confidence_level: str = Field(
	...,
	description="HIGH / MODERATE / LOW",
	)
	risk_band: str = Field(
	...,
	description="LOW / MODERATE / HIGH / CRITICAL",
	)
	module_results: ModuleResults
	total_pipeline_ms: int = Field(..., description="Total wall-clock time in ms")


	class ChatMessage(BaseModel):
	role: str
	content: str

	class ChatRequest(BaseModel):
	messages: List[ChatMessage]
	system_prompt: Optional[str] = None
	persona: Optional[str] = "physician"


	class HealthResponse(BaseModel):
	"""GET /health — liveness and dependency status."""
	status: str = Field(default="ok")
	ollama_available: bool
	version: str = Field(default="0.1.0")


	# ---------------------------------------------------------------------------
	# End-to-end query schemas (POST /query)
	# ---------------------------------------------------------------------------

	class QueryRequest(BaseModel):
	"""POST /query — only a question needed; retrieval + generation happen server-side."""
	question: str = Field(
	...,
	min_length=5,
	max_length=8000,
	description="Medical question (5–8000 chars; may include doc context)",
	examples=["What is the recommended dosage of Metformin for elderly Type 2 Diabetes patients?"],
	)
	top_k: int = Field(
	default=5,
	ge=1,
	le=10,
	description="Number of context chunks to retrieve (1–10)",
	)
	run_ragas: bool = Field(
	default=False,
	description="Run RAGAS evaluation (requires LLM backend)",
	)
	# Per-request LLM overrides — if not set, server config.yaml values are used
	# This makes the eval engine portable: callers bring their own key + model
	llm_provider: Optional[str] = Field(
	default=None,
	description="LLM provider override: 'gemini' or 'ollama'"
	)
	llm_api_key: Optional[str] = Field(
	default=None,
	description="API key override (e.g. Gemini key). Not logged or stored."
	)
	llm_model: Optional[str] = Field(
	default=None,
	description="Model name override (e.g. 'gemini-2.5-flash-lite')"
	)
	ollama_url: Optional[str] = Field(
	default=None,
	description="Ollama base URL override (e.g. 'http://localhost:11434')"
	)
	# Demo/test only — injects a false claim into the LLM answer before evaluation
	# to demonstrate the intervention system catching hallucinations.
	inject_hallucination: Optional[str] = Field(
	default=None,
	description="[DEMO ONLY] Appends a false medical claim to the answer before evaluation."
	)
	# Consensus Engine (Option 2)
	use_consensus: bool = Field(
	default=False,
	description="Run multiple models and compare for clinical agreement."
	)
	# Privacy Shield (Option 1)
	use_privacy_shield: bool = Field(
	default=False,
	description="Automatically redact PHI/PII (names, IDs) before external API calls.",
	)
	system_prompt: Optional[str] = Field(
	default=None,
	description="Custom system prompt to override the default clinical persona."
	)
	persona: Optional[str] = Field(
	default="physician",
	description="The target audience for the response: 'physician' or 'patient'."
	)


	class RetrievedChunk(BaseModel):
	"""A single chunk returned alongside the query response for transparency."""
	chunk_id: Optional[str] = None
	text: str
	source: Optional[str] = None
	pub_type: Optional[str] = None
	pub_year: Optional[int] = None
	title: Optional[str] = None
	similarity_score: Optional[float] = None


	class QueryResponse(BaseModel):
	"""POST /query — full end-to-end response."""
	question: str
	generated_answer: str
	retrieved_chunks: List[RetrievedChunk]
	# Evaluation fields (same as EvaluateResponse)
	composite_score: float = Field(..., ge=0.0, le=1.0)
	hrs: int = Field(..., ge=0, le=100)
	confidence_level: str
	risk_band: str
	module_results: ModuleResults
	total_pipeline_ms: int
	# Intervention fields (active safety gate)
	intervention_applied: bool = Field(
	default=False,
	description="True if the system modified or blocked the response for safety.",
	)
	intervention_reason: Optional[str] = Field(
	default=None,
	description="CRITICAL_BLOCKED \| HIGH_RISK_REGENERATED \| null",
	)
	original_answer: Optional[str] = Field(
	default=None,
	description="The original (unsafe) LLM answer before intervention, for transparency.",
	)
	intervention_details: Optional[Dict[str, Any]] = Field(
	default=None,
	description="Which modules triggered the intervention and their scores.",
	)
	# Consensus fields
	consensus_results: Optional[Dict[str, Any]] = Field(
	default=None,
	description="Results from the multi-model agreement check."
	)
	# Privacy Shield fields
	privacy_applied: bool = Field(default=False)
	privacy_details: Optional[Dict[str, Any]] = Field(default=None)
	# Coverage gap gate — distinguishes missing DB coverage from hallucination
	coverage_gap: bool = Field(
	default=False,
	description="True when retrieval quality is low — the database may lack coverage for this topic.",
	)
	coverage_gap_details: Optional[Dict[str, Any]] = Field(
	default=None,
	description="gap_type (COVERAGE_GAP \| HALLUCINATION), retrieval_confidence, threshold.",
	)