Spaces:

A-R-F
/

Agentic-Reliability-Framework-API

Running

App Files Files Community

petter2025 commited on Feb 19

Commit

5a6ca7f

verified ·

1 Parent(s): 4240faa

Update hf_demo.py

Browse files

Files changed (1) hide show

hf_demo.py +674 -50

hf_demo.py CHANGED Viewed

@@ -1,6 +1,6 @@
 """
-ARF OSS v3.3.9 - Enterprise Lead Generation Engine (API Only)
-Compatible with Pydantic V2
 """
 import os
@@ -12,19 +12,19 @@ import logging
 import sqlite3
 import requests
 import fcntl
-from datetime import datetime
-from typing import Dict, List, Optional, Any, Tuple
 from contextlib import contextmanager
 from enum import Enum
-# FastAPI and Pydantic
 from fastapi import FastAPI, HTTPException, Depends, status
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
 from pydantic import BaseModel, Field, field_validator
 from pydantic_settings import BaseSettings, SettingsConfigDict
-# ============== INFRASTRUCTURE GOVERNANCE MODULE IMPORTS ==============
 from infrastructure import (
     AzureInfrastructureSimulator,
     RegionAllowedPolicy,
@@ -36,7 +36,6 @@ from infrastructure import (
     Environment,
     RecommendedAction,
 )
-import yaml
 # ============== SINGLE INSTANCE LOCK (per port) ==============
 PORT = int(os.environ.get('PORT', 7860))
@@ -51,37 +50,24 @@ except (IOError, OSError):
 # ============== CONFIGURATION (Pydantic V2) ==============
 class Settings(BaseSettings):
-    """Centralized configuration using Pydantic Settings V2"""
-    # Hugging Face settings (aliased to match expected env vars)
     hf_space_id: str = Field(default='local', alias='SPACE_ID')
     hf_token: str = Field(default='', alias='HF_TOKEN')
-    # Persistence - HF persistent storage
     data_dir: str = Field(
         default='/data' if os.path.exists('/data') else './data',
         alias='DATA_DIR'
     )
-    # Lead generation (kept for reference, but UI removed)
     lead_email: str = "petter2025us@outlook.com"
     calendly_url: str = "https://calendly.com/petter2025us/arf-demo"
-    # Webhook for lead alerts (set in HF secrets)
     slack_webhook: str = Field(default='', alias='SLACK_WEBHOOK')
     sendgrid_api_key: str = Field(default='', alias='SENDGRID_API_KEY')
-    # Security
     api_key: str = Field(
         default_factory=lambda: str(uuid.uuid4()),
         alias='ARF_API_KEY'
     )
-    # ARF defaults
     default_confidence_threshold: float = 0.9
     default_max_risk: str = "MEDIUM"
-    # Pydantic V2 configuration
     model_config = SettingsConfigDict(
         populate_by_name=True,
         extra='ignore',
@@ -106,7 +92,7 @@ logging.basicConfig(
 )
 logger = logging.getLogger('arf.oss')
-# ============== ENUMS & TYPES (from original ARF) ==============
 class RiskLevel(str, Enum):
     LOW = "LOW"
     MEDIUM = "MEDIUM"
@@ -126,11 +112,471 @@ class LeadSignal(str, Enum):
     CONFIDENCE_LOW = "confidence_low"
     REPEATED_FAILURE = "repeated_failure"
-# ============== ORIGINAL ARF COMPONENTS (unchanged) ==============
-# ... (BayesianRiskEngine, PolicyEngine, RAGMemory classes as in your original file) ...
-# To keep this message concise, I'm omitting the long original classes.
-# They remain exactly as you had them. The full file would include them here.
-# For brevity, I'll place a placeholder.
 # ============== AUTHENTICATION ==============
 security = HTTPBearer()
@@ -143,8 +589,53 @@ async def verify_api_key(credentials: HTTPAuthorizationCredentials = Depends(sec
         )
     return credentials.credentials
-# ============== PYDANTIC MODELS (existing) ==============
-# ... (ActionRequest, ConfigUpdateRequest, GateResult, EvaluationResponse, LeadSignalResponse) ...
 # ============== NEW INFRASTRUCTURE MODELS ==============
 class InfrastructureIntentRequest(BaseModel):
@@ -154,9 +645,7 @@ class InfrastructureIntentRequest(BaseModel):
     size: Optional[str] = None
     environment: str = "PROD"
     requester: str
-    # For deploy intent
     config_content: Optional[Dict[str, Any]] = None
-    # For grant intent
     permission: Optional[str] = None
     target: Optional[str] = None
@@ -189,11 +678,13 @@ app.add_middleware(
 )
 # Initialize original ARF components
-# ... (risk_engine, policy_engine, memory as in original) ...
-# ============== INFRASTRUCTURE SIMULATOR INSTANCE (cached) ==============
-# For simplicity, we use a default policy. In production, you might load from config.
-_default_policy = RegionAllowedPolicy(regions={"eastus", "westeurope"}) & CostThresholdPolicy(500.0)
 infra_simulator = AzureInfrastructureSimulator(
     policy=_default_policy,
     pricing_file="pricing.yml" if os.path.exists("pricing.yml") else None
@@ -203,7 +694,12 @@ infra_simulator = AzureInfrastructureSimulator(
 @app.get("/")
 async def root():
-    return {"service": "ARF OSS API", "version": "3.3.9", "status": "operational", "docs": "/docs"}
 @app.get("/health")
 async def health_check():
@@ -211,20 +707,153 @@ async def health_check():
         "status": "healthy",
         "version": "3.3.9",
         "edition": "OSS",
-        "memory_entries": 0,  # simplified
         "timestamp": datetime.utcnow().isoformat()
     }
-# ... existing ARF endpoints (get_config, update_config, evaluate_action, etc.) ...
-# ============== NEW INFRASTRUCTURE EVALUATION ENDPOINT ==============
 @app.post("/api/v1/infrastructure/evaluate", dependencies=[Depends(verify_api_key)], response_model=InfrastructureEvaluationResponse)
 async def evaluate_infrastructure_intent(request: InfrastructureIntentRequest):
-    """
-    Evaluate an infrastructure change intent against policies, cost, and risk.
-    """
     try:
-        # Map request to appropriate intent type
         if request.intent_type == "provision":
             if not all([request.resource_type, request.region, request.size]):
                 raise HTTPException(400, "Missing fields for provision intent")
@@ -238,7 +867,7 @@ async def evaluate_infrastructure_intent(request: InfrastructureIntentRequest):
         elif request.intent_type == "deploy":
             intent = DeployConfigurationIntent(
                 service_name=request.resource_type or "unknown",
-                change_scope="canary",  # default; could be made configurable
                 deployment_target=Environment(request.environment.lower()),
                 configuration=request.config_content or {},
                 requester=request.requester
@@ -253,10 +882,8 @@ async def evaluate_infrastructure_intent(request: InfrastructureIntentRequest):
         else:
             raise HTTPException(400, f"Unknown intent type: {request.intent_type}")
-        # Evaluate using the simulator
         healing_intent = infra_simulator.evaluate(intent)
-        # Transform to response model
         return InfrastructureEvaluationResponse(
             recommended_action=healing_intent.recommended_action.value,
             justification=healing_intent.justification,
@@ -275,9 +902,7 @@ async def evaluate_infrastructure_intent(request: InfrastructureIntentRequest):
 # ============== MAIN ENTRY POINT ==============
 if __name__ == "__main__":
     import uvicorn
     port = int(os.environ.get('PORT', 7860))
     logger.info("="*60)
     logger.info("🚀 ARF OSS v3.3.9 (API Only) Starting")
     logger.info(f"📊 Data directory: {settings.data_dir}")
@@ -285,7 +910,6 @@ if __name__ == "__main__":
     logger.info(f"🔑 API Key: {settings.api_key[:8]}... (set in HF secrets)")
     logger.info(f"🌐 Serving API at: http://0.0.0.0:{port}")
     logger.info("="*60)
     uvicorn.run(
         "hf_demo:app",
         host="0.0.0.0",

 """
+ARF OSS v3.3.9 - Enterprise Reliability Engine (Backend API only)
+With integrated Infrastructure Governance Module
 """
 import os
 import sqlite3
 import requests
 import fcntl
 from contextlib import contextmanager
+from datetime import datetime
 from enum import Enum
+from typing import Dict, List, Optional, Any, Tuple
+import yaml
 from fastapi import FastAPI, HTTPException, Depends, status
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
 from pydantic import BaseModel, Field, field_validator
 from pydantic_settings import BaseSettings, SettingsConfigDict
+# ============== INFRASTRUCTURE MODULE IMPORTS ==============
 from infrastructure import (
     AzureInfrastructureSimulator,
     RegionAllowedPolicy,
     Environment,
     RecommendedAction,
 )
 # ============== SINGLE INSTANCE LOCK (per port) ==============
 PORT = int(os.environ.get('PORT', 7860))
 # ============== CONFIGURATION (Pydantic V2) ==============
 class Settings(BaseSettings):
+    """Application settings loaded from environment variables."""
     hf_space_id: str = Field(default='local', alias='SPACE_ID')
     hf_token: str = Field(default='', alias='HF_TOKEN')
     data_dir: str = Field(
         default='/data' if os.path.exists('/data') else './data',
         alias='DATA_DIR'
     )
     lead_email: str = "petter2025us@outlook.com"
     calendly_url: str = "https://calendly.com/petter2025us/arf-demo"
     slack_webhook: str = Field(default='', alias='SLACK_WEBHOOK')
     sendgrid_api_key: str = Field(default='', alias='SENDGRID_API_KEY')
     api_key: str = Field(
         default_factory=lambda: str(uuid.uuid4()),
         alias='ARF_API_KEY'
     )
     default_confidence_threshold: float = 0.9
     default_max_risk: str = "MEDIUM"
     model_config = SettingsConfigDict(
         populate_by_name=True,
         extra='ignore',
 )
 logger = logging.getLogger('arf.oss')
+# ============== ENUMS (original ARF) ==============
 class RiskLevel(str, Enum):
     LOW = "LOW"
     MEDIUM = "MEDIUM"
     CONFIDENCE_LOW = "confidence_low"
     REPEATED_FAILURE = "repeated_failure"
+# ============== ORIGINAL ARF COMPONENTS ==============
+class BayesianRiskEngine:
+    """True Bayesian inference with conjugate priors."""
+    def __init__(self):
+        self.prior_alpha = 2.0
+        self.prior_beta = 5.0
+        self.action_priors = {
+            'database': {'alpha': 1.5, 'beta': 8.0},
+            'network': {'alpha': 3.0, 'beta': 4.0},
+            'compute': {'alpha': 4.0, 'beta': 3.0},
+            'security': {'alpha': 2.0, 'beta': 6.0},
+            'default': {'alpha': 2.0, 'beta': 5.0}
+        }
+        self.evidence_db = f"{settings.data_dir}/evidence.db"
+        self._init_db()
+    def _init_db(self):
+        try:
+            with self._get_db() as conn:
+                conn.execute('''
+                    CREATE TABLE IF NOT EXISTS evidence (
+                        id TEXT PRIMARY KEY,
+                        action_type TEXT,
+                        action_hash TEXT,
+                        success INTEGER,
+                        total INTEGER,
+                        timestamp TEXT,
+                        metadata TEXT
+                    )
+                ''')
+                conn.execute('CREATE INDEX IF NOT EXISTS idx_action_hash ON evidence(action_hash)')
+        except sqlite3.Error as e:
+            logger.error(f"Failed to initialize evidence database: {e}")
+            raise RuntimeError("Could not initialize evidence storage") from e
+    @contextmanager
+    def _get_db(self):
+        conn = None
+        try:
+            conn = sqlite3.connect(self.evidence_db)
+            yield conn
+        except sqlite3.Error as e:
+            logger.error(f"Database error: {e}")
+            raise
+        finally:
+            if conn:
+                conn.close()
+    def classify_action(self, action_text: str) -> str:
+        action_lower = action_text.lower()
+        if any(word in action_lower for word in ['database', 'db', 'sql', 'table', 'drop', 'delete']):
+            return 'database'
+        elif any(word in action_lower for word in ['network', 'firewall', 'load balancer']):
+            return 'network'
+        elif any(word in action_lower for word in ['pod', 'container', 'deploy', 'scale']):
+            return 'compute'
+        elif any(word in action_lower for word in ['security', 'cert', 'key', 'access']):
+            return 'security'
+        else:
+            return 'default'
+    def get_prior(self, action_type: str) -> Tuple[float, float]:
+        prior = self.action_priors.get(action_type, self.action_priors['default'])
+        return prior['alpha'], prior['beta']
+    def get_evidence(self, action_hash: str) -> Tuple[int, int]:
+        try:
+            with self._get_db() as conn:
+                cursor = conn.execute(
+                    'SELECT SUM(success), SUM(total) FROM evidence WHERE action_hash = ?',
+                    (action_hash[:50],)
+                )
+                row = cursor.fetchone()
+                return (row[0] or 0, row[1] or 0) if row else (0, 0)
+        except sqlite3.Error as e:
+            logger.error(f"Failed to retrieve evidence: {e}")
+            return (0, 0)
+    def calculate_posterior(self, action_text: str, context: Dict[str, Any]) -> Dict[str, Any]:
+        action_type = self.classify_action(action_text)
+        alpha0, beta0 = self.get_prior(action_type)
+        action_hash = hashlib.sha256(action_text.encode()).hexdigest()
+        successes, trials = self.get_evidence(action_hash)
+        alpha_n = alpha0 + successes
+        beta_n = beta0 + (trials - successes)
+        posterior_mean = alpha_n / (alpha_n + beta_n)
+        context_multiplier = self._context_likelihood(context)
+        risk_score = posterior_mean * context_multiplier
+        risk_score = min(0.99, max(0.01, risk_score))
+        variance = (alpha_n * beta_n) / ((alpha_n + beta_n)**2 * (alpha_n + beta_n + 1))
+        std_dev = variance ** 0.5
+        ci_lower = max(0.01, posterior_mean - 1.96 * std_dev)
+        ci_upper = min(0.99, posterior_mean + 1.96 * std_dev)
+        if risk_score > 0.8:
+            risk_level = RiskLevel.CRITICAL
+        elif risk_score > 0.6:
+            risk_level = RiskLevel.HIGH
+        elif risk_score > 0.4:
+            risk_level = RiskLevel.MEDIUM
+        else:
+            risk_level = RiskLevel.LOW
+        return {
+            "score": risk_score,
+            "level": risk_level,
+            "credible_interval": [ci_lower, ci_upper],
+            "posterior_parameters": {"alpha": alpha_n, "beta": beta_n},
+            "prior_used": {"alpha": alpha0, "beta": beta0, "type": action_type},
+            "evidence_used": {"successes": successes, "trials": trials},
+            "context_multiplier": context_multiplier,
+            "calculation": f"""
+                Posterior = Beta(α={alpha_n:.1f}, β={beta_n:.1f})
+                Mean = {alpha_n:.1f} / ({alpha_n:.1f} + {beta_n:.1f}) = {posterior_mean:.3f}
+                × Context multiplier {context_multiplier:.2f} = {risk_score:.3f}
+            """
+        }
+    def _context_likelihood(self, context: Dict) -> float:
+        multiplier = 1.0
+        if context.get('environment') == 'production':
+            multiplier *= 1.5
+        elif context.get('environment') == 'staging':
+            multiplier *= 0.8
+        hour = datetime.now().hour
+        if hour < 6 or hour > 22:
+            multiplier *= 1.3
+        if context.get('user_role') == 'junior':
+            multiplier *= 1.4
+        elif context.get('user_role') == 'senior':
+            multiplier *= 0.9
+        if not context.get('backup_available', True):
+            multiplier *= 1.6
+        return multiplier
+    def record_outcome(self, action_text: str, success: bool):
+        action_hash = hashlib.sha256(action_text.encode()).hexdigest()
+        action_type = self.classify_action(action_text)
+        try:
+            with self._get_db() as conn:
+                conn.execute('''
+                    INSERT INTO evidence (id, action_type, action_hash, success, total, timestamp)
+                    VALUES (?, ?, ?, ?, ?, ?)
+                ''', (
+                    str(uuid.uuid4()),
+                    action_type,
+                    action_hash[:50],
+                    1 if success else 0,
+                    1,
+                    datetime.utcnow().isoformat()
+                ))
+                conn.commit()
+            logger.info(f"Recorded outcome for {action_type}: success={success}")
+        except sqlite3.Error as e:
+            logger.error(f"Failed to record outcome: {e}")
+class PolicyEngine:
+    """Deterministic OSS policies – advisory only."""
+    def __init__(self):
+        self.config = {
+            "confidence_threshold": settings.default_confidence_threshold,
+            "max_autonomous_risk": settings.default_max_risk,
+            "risk_thresholds": {
+                RiskLevel.LOW: 0.7,
+                RiskLevel.MEDIUM: 0.5,
+                RiskLevel.HIGH: 0.3,
+                RiskLevel.CRITICAL: 0.1
+            },
+            "destructive_patterns": [
+                r'\bdrop\s+database\b',
+                r'\bdelete\s+from\b',
+                r'\btruncate\b',
+                r'\balter\s+table\b',
+                r'\bdrop\s+table\b',
+                r'\bshutdown\b',
+                r'\bterminate\b',
+                r'\brm\s+-rf\b'
+            ],
+            "require_human": [RiskLevel.CRITICAL, RiskLevel.HIGH],
+            "require_rollback": True
+        }
+    def evaluate(self, action: str, risk: Dict[str, Any], confidence: float) -> Dict[str, Any]:
+        import re
+        gates = []
+        confidence_passed = confidence >= self.config["confidence_threshold"]
+        gates.append({
+            "gate": "confidence_threshold",
+            "passed": confidence_passed,
+            "threshold": self.config["confidence_threshold"],
+            "actual": confidence,
+            "reason": f"Confidence {confidence:.2f} {'≥' if confidence_passed else '<'} threshold {self.config['confidence_threshold']}",
+            "type": "numerical"
+        })
+        risk_levels = list(RiskLevel)
+        max_idx = risk_levels.index(RiskLevel(self.config["max_autonomous_risk"]))
+        action_idx = risk_levels.index(risk["level"])
+        risk_passed = action_idx <= max_idx
+        gates.append({
+            "gate": "risk_assessment",
+            "passed": risk_passed,
+            "max_allowed": self.config["max_autonomous_risk"],
+            "actual": risk["level"].value,
+            "reason": f"Risk level {risk['level'].value} {'≤' if risk_passed else '>'} max autonomous {self.config['max_autonomous_risk']}",
+            "type": "categorical",
+            "metadata": {"risk_score": risk["score"], "credible_interval": risk["credible_interval"]}
+        })
+        is_destructive = any(re.search(pattern, action.lower()) for pattern in self.config["destructive_patterns"])
+        gates.append({
+            "gate": "destructive_check",
+            "passed": not is_destructive,
+            "is_destructive": is_destructive,
+            "reason": "Non-destructive operation" if not is_destructive else "Destructive operation detected",
+            "type": "boolean",
+            "metadata": {"requires_rollback": is_destructive}
+        })
+        requires_human = risk["level"] in self.config["require_human"]
+        gates.append({
+            "gate": "human_review",
+            "passed": not requires_human,
+            "requires_human": requires_human,
+            "reason": "Human review not required" if not requires_human else f"Human review required for {risk['level'].value} risk",
+            "type": "boolean"
+        })
+        gates.append({
+            "gate": "license_check",
+            "passed": True,
+            "edition": "OSS",
+            "reason": "OSS edition - advisory only",
+            "type": "license"
+        })
+        all_passed = all(g["passed"] for g in gates)
+        if not all_passed:
+            required_level = ExecutionLevel.OPERATOR_REVIEW
+        elif risk["level"] == RiskLevel.LOW:
+            required_level = ExecutionLevel.AUTONOMOUS_LOW
+        elif risk["level"] == RiskLevel.MEDIUM:
+            required_level = ExecutionLevel.AUTONOMOUS_HIGH
+        else:
+            required_level = ExecutionLevel.SUPERVISED
+        return {
+            "allowed": all_passed,
+            "required_level": required_level.value,
+            "gates": gates,
+            "advisory_only": True,
+            "oss_disclaimer": "OSS edition provides advisory only. Enterprise adds execution."
+        }
+    def update_config(self, key: str, value: Any):
+        if key in self.config:
+            self.config[key] = value
+            logger.info(f"Policy updated: {key} = {value}")
+            return True
+        return False
+class RAGMemory:
+    """Persistent RAG memory with SQLite and simple embeddings."""
+    def __init__(self):
+        self.db_path = f"{settings.data_dir}/memory.db"
+        self._init_db()
+        self.embedding_cache = {}
+    def _init_db(self):
+        try:
+            with self._get_db() as conn:
+                conn.execute('''
+                    CREATE TABLE IF NOT EXISTS incidents (
+                        id TEXT PRIMARY KEY,
+                        action TEXT,
+                        action_hash TEXT,
+                        risk_score REAL,
+                        risk_level TEXT,
+                        confidence REAL,
+                        allowed BOOLEAN,
+                        gates TEXT,
+                        timestamp TEXT,
+                        embedding TEXT
+                    )
+                ''')
+                conn.execute('''
+                    CREATE TABLE IF NOT EXISTS signals (
+                        id TEXT PRIMARY KEY,
+                        signal_type TEXT,
+                        action TEXT,
+                        risk_score REAL,
+                        metadata TEXT,
+                        timestamp TEXT,
+                        contacted BOOLEAN DEFAULT 0
+                    )
+                ''')
+                conn.execute('CREATE INDEX IF NOT EXISTS idx_action_hash ON incidents(action_hash)')
+                conn.execute('CREATE INDEX IF NOT EXISTS idx_signal_type ON signals(signal_type)')
+                conn.execute('CREATE INDEX IF NOT EXISTS idx_signal_contacted ON signals(contacted)')
+        except sqlite3.Error as e:
+            logger.error(f"Failed to initialize memory database: {e}")
+            raise RuntimeError("Could not initialize memory storage") from e
+    @contextmanager
+    def _get_db(self):
+        conn = None
+        try:
+            conn = sqlite3.connect(self.db_path)
+            conn.row_factory = sqlite3.Row
+            yield conn
+        except sqlite3.Error as e:
+            logger.error(f"Database error in memory: {e}")
+            raise
+        finally:
+            if conn:
+                conn.close()
+    def _simple_embedding(self, text: str) -> List[float]:
+        if text in self.embedding_cache:
+            return self.embedding_cache[text]
+        words = text.lower().split()
+        trigrams = set()
+        for word in words:
+            for i in range(len(word) - 2):
+                trigrams.add(word[i:i+3])
+        vector = [hash(t) % 1000 / 1000.0 for t in sorted(trigrams)[:100]]
+        while len(vector) < 100:
+            vector.append(0.0)
+        vector = vector[:100]
+        self.embedding_cache[text] = vector
+        return vector
+    def store_incident(self, action: str, risk_score: float, risk_level: RiskLevel,
+                       confidence: float, allowed: bool, gates: List[Dict]):
+        action_hash = hashlib.sha256(action.encode()).hexdigest()[:50]
+        embedding = json.dumps(self._simple_embedding(action))
+        try:
+            with self._get_db() as conn:
+                conn.execute('''
+                    INSERT INTO incidents
+                    (id, action, action_hash, risk_score, risk_level, confidence, allowed, gates, timestamp, embedding)
+                    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
+                ''', (
+                    str(uuid.uuid4()),
+                    action[:500],
+                    action_hash,
+                    risk_score,
+                    risk_level.value,
+                    confidence,
+                    1 if allowed else 0,
+                    json.dumps(gates),
+                    datetime.utcnow().isoformat(),
+                    embedding
+                ))
+                conn.commit()
+        except sqlite3.Error as e:
+            logger.error(f"Failed to store incident: {e}")
+    def find_similar(self, action: str, limit: int = 5) -> List[Dict]:
+        query_embedding = self._simple_embedding(action)
+        try:
+            with self._get_db() as conn:
+                cursor = conn.execute('SELECT * FROM incidents ORDER BY timestamp DESC LIMIT 100')
+                incidents = []
+                for row in cursor.fetchall():
+                    stored_embedding = json.loads(row['embedding'])
+                    dot = sum(q * s for q, s in zip(query_embedding, stored_embedding))
+                    norm_q = sum(q*q for q in query_embedding) ** 0.5
+                    norm_s = sum(s*s for s in stored_embedding) ** 0.5
+                    similarity = dot / (norm_q * norm_s) if (norm_q > 0 and norm_s > 0) else 0
+                    incidents.append({
+                        'id': row['id'],
+                        'action': row['action'],
+                        'risk_score': row['risk_score'],
+                        'risk_level': row['risk_level'],
+                        'confidence': row['confidence'],
+                        'allowed': bool(row['allowed']),
+                        'timestamp': row['timestamp'],
+                        'similarity': similarity
+                    })
+                incidents.sort(key=lambda x: x['similarity'], reverse=True)
+                return incidents[:limit]
+        except sqlite3.Error as e:
+            logger.error(f"Failed to find similar incidents: {e}")
+            return []
+    def track_enterprise_signal(self, signal_type: LeadSignal, action: str,
+                                risk_score: float, metadata: Dict = None):
+        signal = {
+            'id': str(uuid.uuid4()),
+            'signal_type': signal_type.value,
+            'action': action[:200],
+            'risk_score': risk_score,
+            'metadata': json.dumps(metadata or {}),
+            'timestamp': datetime.utcnow().isoformat(),
+            'contacted': 0
+        }
+        try:
+            with self._get_db() as conn:
+                conn.execute('''
+                    INSERT INTO signals
+                    (id, signal_type, action, risk_score, metadata, timestamp, contacted)
+                    VALUES (?, ?, ?, ?, ?, ?, ?)
+                ''', (
+                    signal['id'],
+                    signal['signal_type'],
+                    signal['action'],
+                    signal['risk_score'],
+                    signal['metadata'],
+                    signal['timestamp'],
+                    signal['contacted']
+                ))
+                conn.commit()
+        except sqlite3.Error as e:
+            logger.error(f"Failed to track signal: {e}")
+            return None
+        logger.info(f"🔔 Enterprise signal: {signal_type.value} - {action[:50]}...")
+        if signal_type in [LeadSignal.HIGH_RISK_BLOCKED, LeadSignal.NOVEL_ACTION]:
+            self._notify_sales_team(signal)
+        return signal
+    def _notify_sales_team(self, signal: Dict):
+        if settings.slack_webhook:
+            try:
+                requests.post(settings.slack_webhook, json={
+                    "text": f"🚨 *Enterprise Lead Signal*\n"
+                           f"Type: {signal['signal_type']}\n"
+                           f"Action: {signal['action']}\n"
+                           f"Risk Score: {signal['risk_score']:.2f}\n"
+                           f"Time: {signal['timestamp']}\n"
+                           f"Contact: {settings.lead_email}"
+                }, timeout=5)
+            except requests.RequestException as e:
+                logger.error(f"Slack notification failed: {e}")
+    def get_uncontacted_signals(self) -> List[Dict]:
+        try:
+            with self._get_db() as conn:
+                cursor = conn.execute('SELECT * FROM signals WHERE contacted = 0 ORDER BY timestamp DESC')
+                signals = []
+                for row in cursor.fetchall():
+                    signals.append({
+                        'id': row['id'],
+                        'signal_type': row['signal_type'],
+                        'action': row['action'],
+                        'risk_score': row['risk_score'],
+                        'metadata': json.loads(row['metadata']),
+                        'timestamp': row['timestamp']
+                    })
+                return signals
+        except sqlite3.Error as e:
+            logger.error(f"Failed to get uncontacted signals: {e}")
+            return []
+    def mark_contacted(self, signal_id: str):
+        try:
+            with self._get_db() as conn:
+                conn.execute('UPDATE signals SET contacted = 1 WHERE id = ?', (signal_id,))
+                conn.commit()
+        except sqlite3.Error as e:
+            logger.error(f"Failed to mark signal as contacted: {e}")
 # ============== AUTHENTICATION ==============
 security = HTTPBearer()
         )
     return credentials.credentials
+# ============== PYDANTIC SCHEMAS (original) ==============
+class ActionRequest(BaseModel):
+    proposedAction: str = Field(..., min_length=1, max_length=1000)
+    confidenceScore: float = Field(..., ge=0.0, le=1.0)
+    riskLevel: RiskLevel
+    description: Optional[str] = None
+    requiresHuman: bool = False
+    rollbackFeasible: bool = True
+    user_role: str = "devops"
+    session_id: Optional[str] = None
+    @field_validator('proposedAction')
+    @classmethod
+    def validate_action(cls, v: str) -> str:
+        if len(v.strip()) == 0:
+            raise ValueError('Action cannot be empty')
+        return v
+class ConfigUpdateRequest(BaseModel):
+    confidenceThreshold: Optional[float] = Field(None, ge=0.5, le=1.0)
+    maxAutonomousRisk: Optional[RiskLevel] = None
+class GateResult(BaseModel):
+    gate: str
+    reason: str
+    passed: bool
+    threshold: Optional[float] = None
+    actual: Optional[float] = None
+    type: str = "boolean"
+    metadata: Optional[Dict] = None
+class EvaluationResponse(BaseModel):
+    allowed: bool
+    requiredLevel: str
+    gatesTriggered: List[GateResult]
+    shouldEscalate: bool
+    escalationReason: Optional[str] = None
+    executionLadder: Optional[Dict] = None
+    oss_disclaimer: str = "OSS edition provides advisory only. Enterprise adds mechanical gates and execution."
+class LeadSignalResponse(BaseModel):
+    id: str
+    signal_type: str
+    action: str
+    risk_score: float
+    timestamp: str
+    metadata: Dict
 # ============== NEW INFRASTRUCTURE MODELS ==============
 class InfrastructureIntentRequest(BaseModel):
     size: Optional[str] = None
     environment: str = "PROD"
     requester: str
     config_content: Optional[Dict[str, Any]] = None
     permission: Optional[str] = None
     target: Optional[str] = None
 )
 # Initialize original ARF components
+risk_engine = BayesianRiskEngine()
+policy_engine = PolicyEngine()
+memory = RAGMemory()
+# ============== INFRASTRUCTURE SIMULATOR INSTANCE ==============
+# Corrected: RegionAllowedPolicy expects 'allowed_regions', not 'regions'
+_default_policy = RegionAllowedPolicy(allowed_regions={"eastus", "westeurope"}) & CostThresholdPolicy(500.0)
 infra_simulator = AzureInfrastructureSimulator(
     policy=_default_policy,
     pricing_file="pricing.yml" if os.path.exists("pricing.yml") else None
 @app.get("/")
 async def root():
+    return {
+        "service": "ARF OSS API",
+        "version": "3.3.9",
+        "status": "operational",
+        "docs": "/docs"
+    }
 @app.get("/health")
 async def health_check():
         "status": "healthy",
         "version": "3.3.9",
         "edition": "OSS",
+        "memory_entries": len(memory.get_uncontacted_signals()),
         "timestamp": datetime.utcnow().isoformat()
     }
+@app.get("/api/v1/config", dependencies=[Depends(verify_api_key)])
+async def get_config():
+    return {
+        "confidenceThreshold": policy_engine.config["confidence_threshold"],
+        "maxAutonomousRisk": policy_engine.config["max_autonomous_risk"],
+        "riskScoreThresholds": policy_engine.config["risk_thresholds"],
+        "version": "3.3.9",
+        "edition": "OSS"
+    }
+@app.post("/api/v1/config", dependencies=[Depends(verify_api_key)])
+async def update_config(config: ConfigUpdateRequest):
+    if config.confidenceThreshold:
+        policy_engine.update_config("confidence_threshold", config.confidenceThreshold)
+    if config.maxAutonomousRisk:
+        policy_engine.update_config("max_autonomous_risk", config.maxAutonomousRisk.value)
+    return await get_config()
+@app.post("/api/v1/evaluate", dependencies=[Depends(verify_api_key)], response_model=EvaluationResponse)
+async def evaluate_action(request: ActionRequest):
+    try:
+        context = {
+            "environment": "production",
+            "user_role": request.user_role,
+            "backup_available": request.rollbackFeasible,
+            "requires_human": request.requiresHuman
+        }
+        risk = risk_engine.calculate_posterior(
+            action_text=request.proposedAction,
+            context=context
+        )
+        policy = policy_engine.evaluate(
+            action=request.proposedAction,
+            risk=risk,
+            confidence=request.confidenceScore
+        )
+        similar = memory.find_similar(request.proposedAction, limit=3)
+        if not policy["allowed"] and risk["score"] > 0.7:
+            memory.track_enterprise_signal(
+                signal_type=LeadSignal.HIGH_RISK_BLOCKED,
+                action=request.proposedAction,
+                risk_score=risk["score"],
+                metadata={
+                    "confidence": request.confidenceScore,
+                    "risk_level": risk["level"].value,
+                    "failed_gates": [g["gate"] for g in policy["gates"] if not g["passed"]]
+                }
+            )
+        if len(similar) < 2 and risk["score"] > 0.6:
+            memory.track_enterprise_signal(
+                signal_type=LeadSignal.NOVEL_ACTION,
+                action=request.proposedAction,
+                risk_score=risk["score"],
+                metadata={"similar_count": len(similar)}
+            )
+        memory.store_incident(
+            action=request.proposedAction,
+            risk_score=risk["score"],
+            risk_level=risk["level"],
+            confidence=request.confidenceScore,
+            allowed=policy["allowed"],
+            gates=policy["gates"]
+        )
+        gates = []
+        for g in policy["gates"]:
+            gates.append(GateResult(
+                gate=g["gate"],
+                reason=g["reason"],
+                passed=g["passed"],
+                threshold=g.get("threshold"),
+                actual=g.get("actual"),
+                type=g.get("type", "boolean"),
+                metadata=g.get("metadata")
+            ))
+        execution_ladder = {
+            "levels": [
+                {"name": "AUTONOMOUS_LOW", "required": gates[0].passed and gates[1].passed},
+                {"name": "AUTONOMOUS_HIGH", "required": all(g.passed for g in gates[:3])},
+                {"name": "SUPERVISED", "required": all(g.passed for g in gates[:4])},
+                {"name": "OPERATOR_REVIEW", "required": True}
+            ],
+            "current": policy["required_level"]
+        }
+        return EvaluationResponse(
+            allowed=policy["allowed"],
+            requiredLevel=policy["required_level"],
+            gatesTriggered=gates,
+            shouldEscalate=not policy["allowed"],
+            escalationReason=None if policy["allowed"] else "Failed mechanical gates",
+            executionLadder=execution_ladder
+        )
+    except Exception as e:
+        logger.error(f"Evaluation failed: {e}", exc_info=True)
+        raise HTTPException(status_code=500, detail="Internal server error during evaluation")
+@app.get("/api/v1/enterprise/signals", dependencies=[Depends(verify_api_key)])
+async def get_enterprise_signals(contacted: bool = False):
+    try:
+        if contacted:
+            signals = memory.get_uncontacted_signals()
+        else:
+            with memory._get_db() as conn:
+                cursor = conn.execute('''
+                    SELECT * FROM signals
+                    WHERE datetime(timestamp) > datetime('now', '-30 days')
+                    ORDER BY timestamp DESC
+                ''')
+                signals = []
+                for row in cursor.fetchall():
+                    signals.append({
+                        'id': row['id'],
+                        'signal_type': row['signal_type'],
+                        'action': row['action'],
+                        'risk_score': row['risk_score'],
+                        'metadata': json.loads(row['metadata']),
+                        'timestamp': row['timestamp'],
+                        'contacted': bool(row['contacted'])
+                    })
+        return {"signals": signals, "count": len(signals)}
+    except Exception as e:
+        logger.error(f"Failed to retrieve signals: {e}")
+        raise HTTPException(status_code=500, detail="Could not retrieve signals")
+@app.post("/api/v1/enterprise/signals/{signal_id}/contact", dependencies=[Depends(verify_api_key)])
+async def mark_signal_contacted(signal_id: str):
+    memory.mark_contacted(signal_id)
+    return {"status": "success", "message": "Signal marked as contacted"}
+@app.get("/api/v1/memory/similar", dependencies=[Depends(verify_api_key)])
+async def get_similar_actions(action: str, limit: int = 5):
+    similar = memory.find_similar(action, limit=limit)
+    return {"similar": similar, "count": len(similar)}
+@app.post("/api/v1/feedback", dependencies=[Depends(verify_api_key)])
+async def record_outcome(action: str, success: bool):
+    risk_engine.record_outcome(action, success)
+    return {"status": "success", "message": "Outcome recorded"}
+# ============== NEW INFRASTRUCTURE ENDPOINT ==============
 @app.post("/api/v1/infrastructure/evaluate", dependencies=[Depends(verify_api_key)], response_model=InfrastructureEvaluationResponse)
 async def evaluate_infrastructure_intent(request: InfrastructureIntentRequest):
     try:
         if request.intent_type == "provision":
             if not all([request.resource_type, request.region, request.size]):
                 raise HTTPException(400, "Missing fields for provision intent")
         elif request.intent_type == "deploy":
             intent = DeployConfigurationIntent(
                 service_name=request.resource_type or "unknown",
+                change_scope="canary",
                 deployment_target=Environment(request.environment.lower()),
                 configuration=request.config_content or {},
                 requester=request.requester
         else:
             raise HTTPException(400, f"Unknown intent type: {request.intent_type}")
         healing_intent = infra_simulator.evaluate(intent)
         return InfrastructureEvaluationResponse(
             recommended_action=healing_intent.recommended_action.value,
             justification=healing_intent.justification,
 # ============== MAIN ENTRY POINT ==============
 if __name__ == "__main__":
     import uvicorn
     port = int(os.environ.get('PORT', 7860))
     logger.info("="*60)
     logger.info("🚀 ARF OSS v3.3.9 (API Only) Starting")
     logger.info(f"📊 Data directory: {settings.data_dir}")
     logger.info(f"🔑 API Key: {settings.api_key[:8]}... (set in HF secrets)")
     logger.info(f"🌐 Serving API at: http://0.0.0.0:{port}")
     logger.info("="*60)
     uvicorn.run(
         "hf_demo:app",
         host="0.0.0.0",