Spaces:

desolo-2918
/

Insurance-Policy-Analyst

Sleeping

App Files Files Community

desolo-2918 commited on Mar 1

Commit

dfc6f33

verified ·

1 Parent(s): fda9dd1

Create app.py

Browse files

Files changed (1) hide show

app.py +361 -0

app.py ADDED Viewed

	@@ -0,0 +1,361 @@

+import os
+import json
+import re
+import datetime
+import gradio as gr
+import chromadb
+import PyPDF2
+from typing import List, Optional
+from pydantic import BaseModel, Field
+from sentence_transformers import SentenceTransformer
+from smolagents import (
+    tool,
+    ToolCallingAgent,
+    WebSearchTool,
+    OpenAIServerModel,
+    PromptTemplates,
+    PlanningPromptTemplate,
+    ManagedAgentPromptTemplate,
+    FinalAnswerPromptTemplate
+)
+# ==========================================
+# 1. SCHEMAS
+# ==========================================
+class ClaimInfo(BaseModel):
+    claim_number: str
+    policy_number: str
+    claimant_name: str
+    date_of_loss: str
+    loss_description: str
+    estimated_repair_cost: float
+    vehicle_details: Optional[str] = None
+class PolicyQueries(BaseModel):
+    queries: List[str] = Field(default_factory=list)
+class PolicyRecommendation(BaseModel):
+    policy_section: str
+    recommendation_summary: str
+    deductible: Optional[float] = None
+    settlement_amount: Optional[float] = None
+class ClaimDecision(BaseModel):
+    claim_number: str
+    covered: bool
+    deductible: float
+    recommended_payout: float
+    notes: Optional[str] = None
+# ==========================================
+# 2. IMMEDIATE BACKEND INDEXING (Baked-in Knowledge)
+# ==========================================
+embedder = SentenceTransformer('all-MiniLM-L6-v2')
+chroma_client = chromadb.Client()
+collection = chroma_client.get_or_create_collection(name="auto_insurance_policy")
+def initialize_policy_db():
+    policy_file = "policy.pdf"
+    if os.path.exists(policy_file) and collection.count() == 0:
+        print("Indexing Knowledge Base...")
+        with open(policy_file, "rb") as f:
+            reader = PyPDF2.PdfReader(f)
+            policy_text = "".join([page.extract_text() for page in reader.pages])
+        policy_chunks = policy_text.split("\n\n")
+        ids = [f"chunk_{i}" for i in range(len(policy_chunks))]
+        embeddings = embedder.encode(policy_chunks).tolist()
+        collection.add(documents=policy_chunks, embeddings=embeddings, ids=ids)
+        print(f"Knowledge Base Ready: {len(policy_chunks)} chunks indexed.")
+initialize_policy_db()
+# Global LLM placeholder for inner tool usage (updated per session)
+llm_model = None
+# ==========================================
+# 3. CUSTOM TOOLS (Restored & Refined)
+# ==========================================
+@tool
+def parse_claim(json_data: str) -> str:
+    """Parses claim JSON data to validate structure."""
+    try:
+        data = json.loads(json_data)
+        claim_info = ClaimInfo.model_validate(data)
+        return claim_info.model_dump_json()
+    except Exception as e:
+        return f"Error parsing claim: {str(e)}"
+@tool
+def is_valid_query(query: str) -> str:
+    """Validates policy standing and dates against coverage database."""
+    try:
+        claim_info = ClaimInfo.model_validate_json(query)
+        import csv
+        if not os.path.exists("coverage_data.csv"):
+            return json.dumps((False, "System Error: Coverage database not found."))
+        with open("coverage_data.csv", "r") as f:
+            reader = csv.DictReader(f)
+            policy = next((p for p in reader if p["policy_number"] == claim_info.policy_number), None)
+        if not policy: return json.dumps((False, "Policy not found."))
+        dues = policy.get("claim_dues_remaining", "").lower() in ("true", "1", "yes")
+        if dues: return json.dumps((False, "Outstanding dues found."))
+        d_loss = datetime.datetime.strptime(claim_info.date_of_loss, "%Y-%m-%d")
+        d_start = datetime.datetime.strptime(policy["coverage_start_date"], "%Y-%m-%d")
+        d_end = datetime.datetime.strptime(policy["coverage_end_date"], "%Y-%m-%d")
+        if not (d_start <= d_loss <= d_end):
+            return json.dumps((False, "Loss date outside coverage period."))
+        return json.dumps((True, "Valid claim."))
+    except Exception as e:
+        return f"Error: {str(e)}"
+@tool
+def generate_policy_queries(claim_info_json: str) -> str:
+    """Generate queries to retrieve relevant policy sections based on claim info."""
+    global llm_model
+    prompt = f"""
+    Analyze the following auto insurance claim to identify 3-5 key policy sections to consult:
+    - Focus on collision coverage, liability, deductibles, and relevant exclusions or endorsements.
+    - Claim Data: {claim_info_json}
+    - Return a JSON object with a 'queries' field containing a list of strings, e.g., {{"queries": ["query1", "query2"]}}. Do not include metadata fields.
+    """
+    try:
+        messages = [{"role": "user", "content": prompt}]
+        response = llm_model(messages)
+        response_content = response.content if hasattr(response, 'content') else str(response)
+        result = json.loads(response_content)
+        return json.dumps(result)
+    except Exception as e:
+        return f"Error generating policy queries: {str(e)}"
+@tool
+def retrieve_policy_text(queries_json: str) -> str:
+    """Retrieves policy text from ChromaDB using generated queries."""
+    try:
+        queries_data = json.loads(queries_json)
+        query_strings = queries_data.get("queries", [])
+        policy_texts = []
+        for q in query_strings:
+            query_embedding = embedder.encode([q])[0].tolist()
+            results = collection.query(query_embeddings=[query_embedding], n_results=2)
+            if results['documents']:
+                policy_texts.extend(results['documents'][0])
+        return "\n\n".join(set(policy_texts)) # Set removes duplicate chunks
+    except Exception as e:
+        return f"Error: {str(e)}"
+@tool
+def generate_recommendation(claim_info_json: str, policy_text: str) -> str:
+    """Generate a policy recommendation based on claim info and retrieved policy text."""
+    global llm_model
+    prompt = f"""
+    Evaluate the following auto insurance claim against the policy text:
+    - Determine if the collision is covered, the deductible, settlement amount, and applicable policy section.
+    - Claim Info: {claim_info_json}
+    - Policy Text: {policy_text}
+    - Return a JSON object strictly matching this schema:
+      {{
+        "policy_section": "str",
+        "recommendation_summary": "str",
+        "deductible": float or null,
+        "settlement_amount": float or null
+      }}
+    """
+    try:
+        messages = [{"role": "user", "content": prompt}]
+        response = llm_model(messages)
+        response_content = response.content if hasattr(response, 'content') else str(response)
+        result = json.loads(response_content)
+        PolicyRecommendation.model_validate(result) # Validate structure
+        return response_content
+    except Exception as e:
+        return f"Error generating recommendation: {str(e)}"
+@tool
+def finalize_decision(claim_info_json: str, recommendation_json: str) -> str:
+    """Finalize the claim decision based on the recommendation and format output."""
+    try:
+        claim_info = ClaimInfo.model_validate_json(claim_info_json)
+        rec_data = json.loads(recommendation_json)
+        # Safe defaults if the model missed a key
+        covered = "covered" in rec_data.get("recommendation_summary", "").lower() or (rec_data.get("settlement_amount", 0) or 0) > 0
+        deductible = float(rec_data.get("deductible") or 0.0)
+        payout = float(rec_data.get("settlement_amount") or 0.0)
+        decision = ClaimDecision(
+            claim_number=claim_info.claim_number,
+            covered=covered,
+            deductible=deductible,
+            recommended_payout=payout,
+            notes=rec_data.get("recommendation_summary", "No notes provided.")
+        )
+        return decision.model_dump_json(indent=2)
+    except Exception as e:
+        return f"Error finalizing decision: {str(e)}"
+# ==========================================
+# 4. PROMPT TEMPLATES (Restored from notebook)
+# ==========================================
+system_prompt = """
+You are an expert insurance claim-processing agent specializing in auto insurance. You follow a strict, multi-step reasoning process.
+CLAIM PROCESSING ORDER (MANDATORY):
+  1. Parse the claim JSON to extract all ClaimInfo fields using `parse_claim`.
+  2. Validate the claim using `is_valid_query`. If False, STOP immediately and return an invalid-claim decision.
+  3. Generate policy-related search queries based on the extracted claim details using `generate_policy_queries`.
+  4. Retrieve relevant policy text from ChromaDB using `retrieve_policy_text`.
+  5. Use the web search tool to estimate typical repair costs for the described damage. Compare it to the claimed amount. If unreasonable, reject.
+  6. Generate a recommendation using `generate_recommendation`.
+  7. Produce the final claim decision using `finalize_decision`.
+ALWAYS follow this exact sequence. Do not reorder, skip, or combine steps.
+"""
+prompt_templates = PromptTemplates(
+    system_prompt=system_prompt,
+    planning=PlanningPromptTemplate(
+        initial_facts="Claim details:\n{claim_info_json}\nPolicy details:\n{policy_text}",
+        initial_plan="Follow the strict claim processing sequence: Parse -> Validate -> Query -> Retrieve -> Web Search Estimate -> Recommend -> Finalize.",
+        update_facts_pre_messages="Reassess facts:",
+        update_facts_post_messages="Facts updated.",
+        update_plan_pre_messages="Revise plan based on new facts:",
+        update_plan_post_messages="Plan updated."
+    ),
+    managed_agent=ManagedAgentPromptTemplate(
+        task="Process claim: {task_description}",
+        report="Generate final decision: {results}"
+    ),
+    final_answer=FinalAnswerPromptTemplate(
+        pre_messages="Summarize the final claim decision based on your tools.",
+        post_messages="Output clearly formatted decision.",
+        final_answer_template="""### ⚖️ Final Adjudication Result\n\n{final_answer}"""
+    )
+)
+# ==========================================
+# 5. STATELESS PROCESSING GATEKEEPER
+# ==========================================
+def ui_process_claim(api_key, base_url, claim_no, policy_no, name, date, cost, vehicle, desc):
+    """Gatekeeper: validates API key and structures data safely before AI processing."""
+    if not api_key or not api_key.startswith("sk-"):
+        return "### ❌ Error\nPlease provide a valid OpenAI API Key in the Settings tab."
+    payload = {
+        "claim_number": claim_no,
+        "policy_number": policy_no,
+        "claimant_name": name,
+        "date_of_loss": date,
+        "loss_description": desc,
+        "estimated_repair_cost": cost,
+        "vehicle_details": vehicle
+    }
+    return execute_agent_workflow(api_key, base_url, json.dumps(payload))
+def execute_agent_workflow(api_key, base_url, claim_json):
+    global llm_model
+    os.environ['OPENAI_API_KEY'] = api_key
+    os.environ['OPENAI_BASE_URL'] = base_url or "https://api.openai.com/v1"
+    # Initialize stateless model for current user
+    llm_model = OpenAIServerModel(
+        model_id="gpt-4.1",
+        api_base=os.environ['OPENAI_BASE_URL'],
+        api_key=os.environ['OPENAI_API_KEY']
+    )
+    agent = ToolCallingAgent(
+        tools=[
+            parse_claim,
+            is_valid_query,
+            generate_policy_queries,
+            retrieve_policy_text,
+            generate_recommendation,
+            finalize_decision,
+            WebSearchTool()
+        ],
+        model=llm_model,
+        prompt_templates=prompt_templates,
+        add_base_tools=False # Disabled base tools to strictly enforce custom workflow
+    )
+    try:
+        result = agent.run(f"Process this claim JSON strictly according to the mandatory workflow: {claim_json}")
+        return str(result)
+    except Exception as e:
+        return f"### ❌ Agent Execution Error\n{str(e)}"
+# ==========================================
+# 6. GRADIO UI (Guided & Anti-Breakage)
+# ==========================================
+with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Markdown("# 🚗 Agentic Auto-Insurance Claims Processor")
+    gr.Markdown("*The Policy Knowledge Base is initialized and ready. Submit your claim below.*")
+    with gr.Tab("Settings"):
+        api_key_input = gr.Textbox(
+            label="OpenAI API Key",
+            type="password",
+            placeholder="sk-...",
+            info="Your key is only used for this session."
+        )
+        base_url_input = gr.Textbox(label="API Base URL (Optional)", value="https://api.openai.com/v1")
+    with gr.Tab("Claim Adjudicator"):
+        with gr.Row():
+            # Guided User Inputs
+            with gr.Column():
+                gr.Markdown("### 📝 Claim Details")
+                claim_no = gr.Textbox(label="Claim Number", placeholder="CLAIM-100", info="Format: CLAIM-XXX")
+                policy_no = gr.Dropdown(
+                    label="Policy Number",
+                    choices=["PN-1", "PN-2", "PN-3", "PN-4", "PN-5"],
+                    info="Select an active policy ID."
+                )
+                claimant_name = gr.Textbox(label="Claimant Name", placeholder="Jane Doe")
+                loss_date = gr.Textbox(label="Date of Loss", placeholder="YYYY-MM-DD", info="Must follow YYYY-MM-DD format.")
+                loss_desc = gr.Textbox(
+                    label="Loss Description",
+                    placeholder="Describe the incident...",
+                    lines=2
+                )
+                repair_cost = gr.Number(
+                    label="Estimated Repair Cost ($)",
+                    value=500.0,
+                    minimum=0,
+                    info="Do not use negative values."
+                )
+                vehicle_info = gr.Textbox(label="Vehicle Details", placeholder="2022 Tesla Model 3")
+                submit_btn = gr.Button("Evaluate Claim", variant="primary")
+            # Decision Output
+            with gr.Column():
+                gr.Markdown("### ⚖️ Agent Decision")
+                output_display = gr.Markdown(value="*Results will appear here after evaluation...*")
+        # Preset Examples Component
+        gr.Examples(
+            examples=[
+                ["CLAIM-001", "PN-1", "John Smith", "2023-10-15", 850.0, "2020 Honda Civic", "Front bumper damage from low-speed collision."],
+                ["CLAIM-002", "PN-3", "Alice Wong", "2024-02-10", 12000.0, "2023 Ford F-150", "Extensive side impact damage from running a red light."],
+            ],
+            inputs=[claim_no, policy_no, claimant_name, loss_date, repair_cost, vehicle_info, loss_desc],
+            label="Load Example Claims"
+        )
+    submit_btn.click(
+        fn=ui_process_claim,
+        inputs=[api_key_input, base_url_input, claim_no, policy_no, claimant_name, loss_date, repair_cost, vehicle_info, loss_desc],
+        outputs=output_display
+    )
+if __name__ == "__main__":
+    demo.launch()