Spaces:

parth0908
/

contract-risk-env

Runtime error

App Files Files Community

contract-risk-env / server /app.py

parth0908

Upload server/app.py with huggingface_hub

5cdb517 verified about 2 months ago

raw

history blame contribute delete

7.49 kB

	"""FastAPI server — OpenEnv standard + competition endpoints (/tasks, /grader, /baseline)."""

	from __future__ import annotations

	import sys
	from pathlib import Path
	from typing import Any, Dict, List, Optional

	from fastapi import FastAPI
	from openenv.core.env_server import create_fastapi_app
	from pydantic import BaseModel, Field

	from contract_risk_env.models import ClauseFlag, ContractAction, ContractObservation, ContractState
	from .corpus import get_labels, list_contracts, get_contract
	from .environment import ContractRiskEnvironment
	from .graders import grade

	# ── Standard OpenEnv app ────────────────────────────────────────────────────

	app = create_fastapi_app(ContractRiskEnvironment, ContractAction, ContractObservation)


	# ── Competition endpoints ───────────────────────────────────────────────────

	@app.get("/tasks")
	def get_tasks() -> List[Dict[str, Any]]:
	"""List all tasks with their action schemas."""
	tasks = [
	{
	"task_id": "easy",
	"description": "SaaS subscription agreement — 6 explicit risks with clear headings. Expected F1 ~0.85 for GPT-4o baseline.",
	"difficulty": "easy",
	"expected_f1_baseline": 0.85,
	"action_schema": ContractAction.model_json_schema(),
	},
	{
	"task_id": "medium",
	"description": "IP licensing agreement — risks buried in cross-references between definitions and operative clauses. Expected F1 ~0.51.",
	"difficulty": "medium",
	"expected_f1_baseline": 0.51,
	"action_schema": ContractAction.model_json_schema(),
	},
	{
	"task_id": "hard",
	"description": "Enterprise MSA — risks hidden inside clauses that appear protective on first reading. Expected F1 ~0.29.",
	"difficulty": "hard",
	"expected_f1_baseline": 0.29,
	"action_schema": ContractAction.model_json_schema(),
	},
	]
	return tasks


	class GraderRequest(BaseModel):
	episode_id: str = ""
	action: Dict[str, Any] = Field(default_factory=dict)
	contract_id: str = ""


	@app.post("/grader")
	def grade_episode(req: GraderRequest) -> Dict[str, Any]:
	"""Score a completed episode given the action and contract_id."""
	labels = get_labels(req.contract_id)
	flagged = req.action.get("flagged_clauses", [])
	result = grade(flagged, labels)
	result["episode_id"] = req.episode_id
	result["contract_id"] = req.contract_id
	return result


	# ── Baseline heuristic (keyword matching, no LLM) ──────────────────────────

	_KEYWORD_RULES: List[Dict[str, Any]] = [
	{
	"pattern": r"(?i)auto(?:matic(?:ally)?)?[\s\-]*renew",
	"risk_type": "auto_renewal",
	"severity": 2,
	},
	{
	"pattern": r"(?i)unlimited\s+liability\|liability.*?(?:shall\s+be\s+unlimited\|no\s+cap\|without\s+limit)",
	"risk_type": "unlimited_liability",
	"severity": 3,
	},
	{
	"pattern": r"(?i)unilateral(?:ly)?\s+(?:amend\|modif\|change)\|reserves?\s+the\s+right\s+to\s+modify",
	"risk_type": "unilateral_amendment",
	"severity": 3,
	},
	{
	"pattern": r"(?i)(?:irrevocabl[ye]\s+assign\|hereby\s+assigned\s+to\|shall\s+(?:automatically\s+)?vest\s+in\s+and\s+be\s+assigned)",
	"risk_type": "ip_assignment_overreach",
	"severity": 3,
	},
	{
	"pattern": r"(?i)indemnif.*?(?:not\s+subject\s+to\s+any\s+cap\|unlimited\|any\s+and\s+all\s+(?:claims\|losses\|damages))",
	"risk_type": "indemnification_asymmetry",
	"severity": 2,
	},
	{
	"pattern": r"(?i)(?:perpetual\|irrevocable).?(?:royalty[\s\-]free)?.?license\s+to\s+use\s+(?:Customer\|Client)\s+Data\|(?:Usage\s+Data\|Derived\s+Models?).?(?:own\|sell\|sublicense\|commercial)",
	"risk_type": "data_ownership_ambiguity",
	"severity": 2,
	},
	{
	"pattern": r"(?i)terminat(?:e\|ion)\s+(?:for\s+convenience\|at\s+any\s+time\s+for\s+any\s+reason\|without\s+cause)",
	"risk_type": "termination_without_cause",
	"severity": 2,
	},
	{
	"pattern": r"(?i)evergreen\s+term",
	"risk_type": "auto_renewal",
	"severity": 3,
	},
	{
	"pattern": r"(?i)notwithstanding\s+subsections?\s+\(a\).?(?:exclusive\|perpetual\|irrevocable).?(?:commercialize\|exploit\|sublicense)",
	"risk_type": "ip_assignment_overreach",
	"severity": 3,
	},
	{
	"pattern": r"(?i)(?:mutual\s+liability\s+cap\|exceptions?\s+to\s+(?:mutual\s+)?liability).*?(?:shall\s+not\s+apply\|no\s+cap\|unlimited)",
	"risk_type": "unlimited_liability",
	"severity": 3,
	},
	{
	"pattern": r"(?i)service\s+continuity\s+provision.*?(?:automatically\s+extend\|renewal\s+trigger)",
	"risk_type": "auto_renewal",
	"severity": 3,
	},
	]


	import re as _re


	def _run_baseline_heuristic(task_id: str) -> Dict[str, Any]:
	"""Keyword-based baseline — no API key required."""
	contract = get_contract(task_id)
	labels = contract["labels"]
	text = contract["text"]

	# Split text into sections for clause_id extraction
	flagged: List[Dict[str, Any]] = []
	seen_clause_ids: set = set()

	for rule in _KEYWORD_RULES:
	for m in _re.finditer(rule["pattern"], text):
	# Try to find nearest section number
	preceding = text[max(0, m.start() - 300): m.start()]
	section_matches = list(_re.finditer(r"(\d+)\.(\d+)", preceding))
	if section_matches:
	last = section_matches[-1]
	clause_id = f"clause_{last.group(1)}_{last.group(2)}"
	else:
	# try in the match itself
	in_match = _re.search(r"(\d+)\.(\d+)", text[m.start(): m.end() + 100])
	if in_match:
	clause_id = f"clause_{in_match.group(1)}_{in_match.group(2)}"
	else:
	clause_id = f"clause_unknown_{m.start()}"

	if clause_id not in seen_clause_ids:
	seen_clause_ids.add(clause_id)
	span = text[m.start(): min(m.end() + 100, len(text))]
	flagged.append({
	"clause_id": clause_id,
	"risk_type": rule["risk_type"],
	"severity": rule["severity"],
	"span_text": span[:200],
	})

	result = grade(flagged, labels)
	result["flagged_count"] = len(flagged)
	result["task_id"] = task_id
	return result


	@app.get("/baseline")
	def run_baseline() -> Dict[str, Any]:
	"""Run keyword-matching heuristic against all 3 tasks. No API key needed."""
	scores: Dict[str, Any] = {}
	total = 0.0
	for tid in ("easy", "medium", "hard"):
	r = _run_baseline_heuristic(tid)
	scores[tid] = {
	"reward": r["reward"],
	"precision": r["precision"],
	"recall": r["recall"],
	"f1": r["f1"],
	"flagged_count": r["flagged_count"],
	}
	total += r["reward"]
	scores["mean"] = round(total / 3, 4)
	return scores

	def main():
	import uvicorn
	uvicorn.run("server.app:app", host="0.0.0.0", port=8000)

	if __name__ == "__main__":
	main()