Spaces:

nothingworry
/

IntegraChat

Sleeping

App Files Files Community

nothingworry commited on Nov 19, 2025

Commit

c509b44

1 Parent(s): f5cdb7d

working Tenant ID

Browse files

Files changed (20) hide show

README.md +99 -20
TESTING_GUIDE.md +430 -0
backend/api/routes/admin.py +156 -10
backend/api/routes/agent.py +89 -0
backend/api/routes/analytics.py +75 -38
backend/api/services/agent_orchestrator.py +282 -9
backend/api/storage/analytics_store.py +401 -0
backend/api/storage/rules_store.py +64 -5
backend/mcp_servers/database.py +22 -4
backend/mcp_servers/main.py +13 -1
backend/mcp_servers/rag_server.py +17 -26
backend/tests/test_analytics_store.py +208 -0
backend/tests/test_api_endpoints.py +202 -0
backend/tests/test_enhanced_admin_rules.py +195 -0
check_rag_database.py +125 -0
data/admin_rules.db +0 -0
data/analytics.db +0 -0
test_manual.py +306 -0
test_simple.py +148 -0
verify_tenant_isolation.py +449 -0

README.md CHANGED Viewed

@@ -1,4 +1,4 @@
-# IntegraChat — MCP Autonomous Agent
 **Track:** MCP in Action
 **Category:** Enterprise
@@ -8,23 +8,38 @@
 ## Overview
-IntegraChat is an enterprise-ready, multi-tenant AI platform that demonstrates the full capabilities of the **Model Context Protocol (MCP)** in a production-style environment. It combines autonomous tool-using agents, RAG retrieval, live web search, and admin governance under strict tenant isolation.
-This Hugging Face Space provides a Gradio interface to interact with the IntegraChat MCP backend, showcasing how MCP can power intelligent, governed, multi-tenant AI systems.
 ---
 ## Features
-- 🤖 **Autonomous MCP Agents** – Tool-aware FastAPI agent that plans across RAG, Web, Admin, and LLM actions
-- 📚 **Knowledge Base Management** – Upload raw text, URLs, or documents (PDF/DOCX/TXT/MD) and manage your ingested content with delete functionality
-- 🗑️ **Document Deletion** – Delete individual documents or bulk delete all documents for a tenant with confirmation dialogs
-- 🛡️ **Admin Rules Management** – Dedicated tab to add/delete governance rules; all rules are persisted in SQLite for demo purposes and enforced during every chat request
-- 📊 **Admin Analytics** – Snapshot of tenant activity, tool usage, red-flag triggers, and overall query volume
 - 🌐 **Live Web Search** – DuckDuckGo-based MCP server with English-biased results
-- 🏢 **Multi-Tenant Isolation** – Centralized tenant ID management with persistent storage; backend enforces strict isolation for chat, ingestion, and admin ops
-- 🔄 **Multi-Tool Selection** – MCP agent orchestrator picks the right tool chain (RAG + Web + LLM, etc.)
-- ⚡ **Improved Error Handling** – Better error messages, connection error detection, and retry mechanisms
 ---
@@ -93,28 +108,80 @@ Then open `http://localhost:3000`. The navbar links on the landing page route to
 ---
-## API endpoints used by the Space
-| Purpose | Method & Path | Notes |
 | --- | --- | --- |
-| Chat with agent | `POST /agent/message` | Body includes `tenant_id`, `message`, optional history |
-| Ingest document (text/URL) | `POST /rag/ingest-document` | Accepts `source_type`, `content`, metadata |
-| Ingest file | `POST /rag/ingest-file` | Multipart upload with `x-tenant-id` header |
 | List documents | `GET /rag/list` | Returns all documents for a tenant with pagination |
 | Delete document | `DELETE /rag/delete/{document_id}` | Deletes a specific document by ID |
 | Delete all documents | `DELETE /rag/delete-all` | Deletes all documents for a tenant |
-| List analytics | `GET /analytics/overview` etc. | Used for Admin Analytics tab |
-| Manage rules | `GET/POST/DELETE /admin/rules` | Backend now persists rules in SQLite demo store |
 All calls are proxied through the FastAPI backend running at `http://localhost:8000`. Ensure those services are online before launching the Space.
 ---
 ## Demo Video
 🎥 **[Demo Video Placeholder]** - Coming soon!
-Watch how IntegraChat uses MCP to power autonomous agents with multi-tool selection, RAG retrieval, and governance.
 ---
@@ -138,11 +205,21 @@ This project is licensed under the MIT License - see the [LICENSE](LICENSE) file
 ---
 ## Acknowledgments
 - Built with [Model Context Protocol (MCP)](https://modelcontextprotocol.io/)
 - Powered by [Gradio](https://gradio.app/) for the interface
 - Backend built with [FastAPI](https://fastapi.tiangolo.com/)
 ---
@@ -150,6 +227,8 @@ This project is licensed under the MIT License - see the [LICENSE](LICENSE) file
 **Made with ❤️ for the MCP Hackathon**
-[⬆ Back to Top](#integrachat--mcp-autonomous-agent)
 </div>

+# IntegraChat — Enterprise MCP Autonomous Agent Platform
 **Track:** MCP in Action
 **Category:** Enterprise
 ## Overview
+**IntegraChat** is an enterprise-grade, multi-tenant AI platform that demonstrates the full capabilities of the **Model Context Protocol (MCP)** in a production-style environment. Built with enterprise governance and observability in mind, IntegraChat combines autonomous tool-using agents, RAG retrieval, live web search, and admin compliance under strict tenant isolation.
+This platform showcases how MCP can power intelligent, governed, multi-tenant AI systems with real-time analytics, regex-based red-flag detection, and comprehensive tool orchestration.
 ---
 ## Features
+### Core Capabilities
+- 🤖 **Autonomous Multi-Step MCP Agents** – Intelligent tool-aware agent that plans and executes multi-step workflows across RAG, Web, Admin, and LLM tools with memory of previous tool outputs
+- 📚 **Enhanced Knowledge Base Management** – Upload raw text, URLs, or documents (PDF/DOCX/TXT/MD) with rich metadata (source URL, timestamp, document type) and optimized chunking (400-600 tokens)
+- 🗑️ **Document Management** – Delete individual documents or bulk delete all documents for a tenant with confirmation dialogs
+- 🛡️ **Enterprise Admin Governance** – Regex-based red-flag pattern matching with severity levels (low/medium/high/critical) and automatic admin alerts
+- 📊 **Comprehensive Analytics & Observability** – Full tenant-level analytics logging with SQLite backend:
+  - Tool usage breakdown (RAG, Web, Admin, LLM) with latency and token tracking
+  - RAG recall/precision indicators (average hits, scores, top scores)
+  - Per-tenant query volume and active users
+  - Red-flag violations with timestamps and confidence scores
+  - LLM token logs and latency metrics
 - 🌐 **Live Web Search** – DuckDuckGo-based MCP server with English-biased results
+- 🏢 **Multi-Tenant Isolation** – Complete tenant isolation with centralized tenant ID management; backend enforces strict isolation for chat, ingestion, and admin ops
+- 🔄 **Intelligent Multi-Tool Orchestration** – MCP agent orchestrator autonomously selects optimal tool chains (RAG + Web + LLM, etc.) based on query intent and context
+- ⚡ **Robust Error Handling** – Structured error responses, retry mechanisms, and graceful fallbacks (e.g., if RAG fails → fallback to LLM-only)
+### Enterprise Features
+- 🔍 **Regex-Based Red-Flag Detection** – Support for complex regex patterns with keyword fallback and semantic scoring
+- 📈 **Real-Time Analytics Dashboard** – Per-tenant analytics with configurable time windows (7, 30, 90 days)
+- 🛠️ **Admin API Endpoints** – `/admin/violations`, `/admin/tools/logs`, `/admin/tenants` for comprehensive governance
+- 🧠 **Agent Debug & Planning** – `/agent/debug` and `/agent/plan` endpoints for observability and tool selection inspection
+- 💾 **Persistent Analytics Storage** – SQLite-based analytics store with indexes for fast queries
 ---
 ---
+## API Endpoints
+### Agent Endpoints
+| Purpose | Method & Path | Description |
 | --- | --- | --- |
+| Chat with agent | `POST /agent/message` | Main chat endpoint with `tenant_id`, `message`, optional history |
+| Agent debug | `POST /agent/debug` | Returns detailed debugging info: reasoning trace, tool selection, intent classification |
+| Agent plan | `POST /agent/plan` | Returns tool selection plan without execution (intent, tool scores, planned steps) |
+### RAG Endpoints
+| Purpose | Method & Path | Description |
+| --- | --- | --- |
+| Ingest document | `POST /rag/ingest-document` | Accepts `source_type`, `content`, metadata (filename, URL, doc_id) |
+| Ingest file | `POST /rag/ingest-file` | Multipart upload with `x-tenant-id` header (PDF/DOCX/TXT/MD) |
 | List documents | `GET /rag/list` | Returns all documents for a tenant with pagination |
 | Delete document | `DELETE /rag/delete/{document_id}` | Deletes a specific document by ID |
 | Delete all documents | `DELETE /rag/delete-all` | Deletes all documents for a tenant |
+### Admin & Governance Endpoints
+| Purpose | Method & Path | Description |
+| --- | --- | --- |
+| List rules | `GET /admin/rules?detailed=true` | Get all rules (use `detailed=true` for regex/severity metadata) |
+| Add rule | `POST /admin/rules` | Add rule with optional `pattern` (regex), `severity` (low/medium/high/critical), `description` |
+| Delete rule | `DELETE /admin/rules/{rule}` | Delete a specific rule |
+| List violations | `GET /admin/violations?days=30&limit=50` | Get red-flag violations with timestamps and confidence scores |
+| Tool logs | `GET /admin/tools/logs?tool_name=rag&days=7` | Get detailed tool usage logs with latency and token counts |
+| Manage tenants | `GET/POST/DELETE /admin/tenants` | Tenant management endpoints (placeholder implementation) |
+### Analytics Endpoints
+| Purpose | Method & Path | Description |
+| --- | --- | --- |
+| Overview | `GET /analytics/overview?days=30` | Comprehensive analytics: total queries, tool usage, red-flag count, RAG quality |
+| Tool usage | `GET /analytics/tool-usage?days=30` | Detailed tool usage stats: counts, latency, tokens, success/error rates |
+| Red flags | `GET /analytics/redflags?limit=50&days=30` | Recent red-flag violations for tenant |
+| Activity | `GET /analytics/activity?days=30` | Tenant activity summary: queries, active users, last query timestamp |
+| RAG quality | `GET /analytics/rag-quality?days=30` | RAG quality metrics: avg hits, scores, latency (recall/precision indicators) |
 All calls are proxied through the FastAPI backend running at `http://localhost:8000`. Ensure those services are online before launching the Space.
 ---
+## Architecture Highlights
+### Enterprise-Grade Features
+1. **Autonomous Multi-Step Planning**: The agent uses LLM-powered planning to determine optimal tool sequences, with memory of previous tool outputs in multi-step workflows.
+2. **Regex-Based Governance**: Admin rules support regex patterns with fallback to keyword matching and semantic similarity scoring for flexible policy enforcement.
+3. **Comprehensive Analytics**: All tool usage, RAG searches, LLM calls, and red-flag violations are logged to SQLite with indexed queries for fast analytics retrieval.
+4. **Enhanced RAG Pipeline**: Documents are chunked with optimal size (400-600 tokens) and enriched with metadata (source URL, timestamp, document type) for better retrieval.
+5. **Structured Error Handling**: All errors are logged with context, and the system gracefully falls back (e.g., if RAG fails → use LLM-only, if web fails → skip web).
+### Data Storage
+- **SQLite Databases** (for demo/development):
+  - `data/admin_rules.db` - Admin rules with regex patterns and severity
+  - `data/analytics.db` - Analytics events, tool usage, violations, RAG metrics
+- **Production Ready**: Can easily swap SQLite for PostgreSQL/Supabase for production deployments.
+---
 ## Demo Video
 🎥 **[Demo Video Placeholder]** - Coming soon!
+Watch how IntegraChat uses MCP to power autonomous agents with multi-tool selection, RAG retrieval, and enterprise governance.
 ---
 ---
+## Technical Stack
+- **Backend**: FastAPI with async/await for high-performance MCP orchestration
+- **Frontend**: Gradio interface + Next.js operator console
+- **LLM Integration**: Ollama (local) or Groq (cloud) via configurable backend
+- **Vector Store**: pgvector (via Supabase) or SQLite embeddings
+- **Analytics**: SQLite with indexed queries for fast analytics
+- **MCP Servers**: RAG (8001), Web (8002), Admin (8003)
 ## Acknowledgments
 - Built with [Model Context Protocol (MCP)](https://modelcontextprotocol.io/)
 - Powered by [Gradio](https://gradio.app/) for the interface
 - Backend built with [FastAPI](https://fastapi.tiangolo.com/)
+- Analytics and governance features inspired by enterprise AI platform requirements
 ---
 **Made with ❤️ for the MCP Hackathon**
+**IntegraChat: Enterprise-Grade MCP Autonomous Agent Platform**
+[⬆ Back to Top](#integrachat--enterprise-mcp-autonomous-agent-platform)
 </div>

TESTING_GUIDE.md ADDED Viewed

	@@ -0,0 +1,430 @@

+# IntegraChat Testing Guide
+This guide explains how to test all the new features and improvements in IntegraChat.
+## Prerequisites
+1. **Install Dependencies**
+   ```bash
+   pip install -r requirements.txt
+   ```
+2. **Environment Setup**
+   - Create a `.env` file or set environment variables
+   - Optional: Set up Ollama for LLM testing
+   - Optional: Set up Supabase for production analytics
+## Test Structure
+### 1. Unit Tests
+Run unit tests for individual components:
+```bash
+# Run all unit tests
+pytest backend/tests/
+# Run specific test files
+pytest backend/tests/test_analytics_store.py -v
+pytest backend/tests/test_enhanced_admin_rules.py -v
+pytest backend/tests/test_api_endpoints.py -v
+# Run with coverage
+pytest backend/tests/ --cov=backend/api --cov-report=html
+```
+### 2. Integration Tests
+Test API endpoints with the FastAPI test client:
+```bash
+pytest backend/tests/test_api_endpoints.py -v
+```
+**Note**: Some integration tests may fail if MCP servers or LLM are not running. That's expected.
+### 3. Manual Testing Scripts
+Create test data and verify functionality manually:
+#### A. Test Analytics Store
+```bash
+python -c "
+from backend.api.storage.analytics_store import AnalyticsStore
+import time
+store = AnalyticsStore()
+# Log tool usage
+store.log_tool_usage('test_tenant', 'rag', latency_ms=150, tokens_used=500, success=True)
+store.log_tool_usage('test_tenant', 'web', latency_ms=80, success=True)
+# Log red-flag violation
+store.log_redflag_violation(
+    'test_tenant',
+    'rule1',
+    '.*password.*',
+    'high',
+    'password123',
+    confidence=0.95
+)
+# Log RAG search
+store.log_rag_search('test_tenant', 'test query', hits_count=5, avg_score=0.85, top_score=0.92)
+# Log agent query
+store.log_agent_query('test_tenant', 'test message', intent='rag', tools_used=['rag', 'llm'], total_tokens=1000)
+# Get stats
+print('Tool Usage:', store.get_tool_usage_stats('test_tenant'))
+print('Violations:', store.get_redflag_violations('test_tenant'))
+print('Activity:', store.get_activity_summary('test_tenant'))
+print('RAG Quality:', store.get_rag_quality_metrics('test_tenant'))
+"
+```
+#### B. Test Admin Rules with Regex
+```bash
+python -c "
+from backend.api.storage.rules_store import RulesStore
+import re
+store = RulesStore()
+# Add rule with regex pattern
+store.add_rule(
+    'test_tenant',
+    'Block password queries',
+    pattern='.*password.*|.*pwd.*',
+    severity='high',
+    description='Blocks password-related queries'
+)
+# Get detailed rules
+rules = store.get_rules_detailed('test_tenant')
+print('Rules:', rules)
+# Test regex matching
+pattern = rules[0]['pattern']
+regex = re.compile(pattern, re.IGNORECASE)
+test_text = 'What is my password?'
+match = regex.search(test_text)
+print(f'Match for \"{test_text}\": {match is not None}')
+"
+```
+## API Endpoint Testing
+### Using curl
+#### 1. Test Analytics Endpoints
+```bash
+# Overview
+curl -X GET "http://localhost:8000/analytics/overview?days=30" \
+  -H "x-tenant-id: test_tenant"
+# Tool Usage
+curl -X GET "http://localhost:8000/analytics/tool-usage?days=30" \
+  -H "x-tenant-id: test_tenant"
+# RAG Quality
+curl -X GET "http://localhost:8000/analytics/rag-quality?days=30" \
+  -H "x-tenant-id: test_tenant"
+# Red Flags
+curl -X GET "http://localhost:8000/analytics/redflags?limit=50&days=30" \
+  -H "x-tenant-id: test_tenant"
+```
+#### 2. Test Admin Endpoints
+```bash
+# Add rule with regex and severity
+curl -X POST "http://localhost:8000/admin/rules" \
+  -H "x-tenant-id: test_tenant" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "rule": "Block password queries",
+    "pattern": ".*password.*",
+    "severity": "high",
+    "description": "Blocks password-related queries"
+  }'
+# Get detailed rules
+curl -X GET "http://localhost:8000/admin/rules?detailed=true" \
+  -H "x-tenant-id: test_tenant"
+# Get violations
+curl -X GET "http://localhost:8000/admin/violations?limit=50&days=30" \
+  -H "x-tenant-id: test_tenant"
+# Get tool logs
+curl -X GET "http://localhost:8000/admin/tools/logs?tool_name=rag&days=7" \
+  -H "x-tenant-id: test_tenant"
+```
+#### 3. Test Agent Endpoints
+```bash
+# Agent chat (normal)
+curl -X POST "http://localhost:8000/agent/message" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "tenant_id": "test_tenant",
+    "message": "What is the company policy?",
+    "temperature": 0.0
+  }'
+# Agent debug
+curl -X POST "http://localhost:8000/agent/debug" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "tenant_id": "test_tenant",
+    "message": "What is the company policy?",
+    "temperature": 0.0
+  }'
+# Agent plan
+curl -X POST "http://localhost:8000/agent/plan" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "tenant_id": "test_tenant",
+    "message": "What is the company policy?",
+    "temperature": 0.0
+  }'
+```
+### Using Python requests
+Create a test script `test_api_manual.py`:
+```python
+import requests
+import json
+BASE_URL = "http://localhost:8000"
+TENANT_ID = "test_tenant"
+headers = {"x-tenant-id": TENANT_ID}
+# Test analytics
+print("Testing Analytics Endpoints...")
+response = requests.get(f"{BASE_URL}/analytics/overview?days=30", headers=headers)
+print(f"Overview: {response.status_code} - {json.dumps(response.json(), indent=2)}")
+response = requests.get(f"{BASE_URL}/analytics/tool-usage?days=30", headers=headers)
+print(f"Tool Usage: {response.status_code} - {json.dumps(response.json(), indent=2)}")
+# Test admin rules
+print("\nTesting Admin Rules...")
+response = requests.post(
+    f"{BASE_URL}/admin/rules",
+    headers=headers,
+    json={
+        "rule": "Block password queries",
+        "pattern": ".*password.*",
+        "severity": "high"
+    }
+)
+print(f"Add Rule: {response.status_code} - {json.dumps(response.json(), indent=2)}")
+response = requests.get(
+    f"{BASE_URL}/admin/rules?detailed=true",
+    headers=headers
+)
+print(f"Get Rules: {response.status_code} - {json.dumps(response.json(), indent=2)}")
+# Test agent endpoints
+print("\nTesting Agent Endpoints...")
+response = requests.post(
+    f"{BASE_URL}/agent/plan",
+    json={
+        "tenant_id": TENANT_ID,
+        "message": "What is the company policy?",
+        "temperature": 0.0
+    }
+)
+print(f"Agent Plan: {response.status_code} - {json.dumps(response.json(), indent=2)}")
+```
+Run it:
+```bash
+python test_api_manual.py
+```
+## End-to-End Testing Workflow
+### Step 1: Start Backend Services
+```bash
+# Terminal 1: Start FastAPI backend
+cd backend/api
+uvicorn main:app --port 8000 --reload
+# Terminal 2: Start RAG MCP server
+cd backend/mcp_servers
+python main.py  # or uvicorn main:app --port 8001
+# Terminal 3: Start Web MCP server
+cd backend/mcp_servers
+python web_server.py  # or uvicorn web_server:app --port 8002
+# Terminal 4: Start Admin MCP server
+cd backend/mcp_servers
+python admin_server.py  # or uvicorn admin_server:app --port 8003
+# Optional: Start Ollama for LLM
+ollama serve
+```
+### Step 2: Generate Test Data
+Run the analytics and rules tests to populate the database:
+```bash
+pytest backend/tests/test_analytics_store.py -v
+pytest backend/tests/test_enhanced_admin_rules.py -v
+```
+### Step 3: Test Agent Flow
+1. **Add some admin rules:**
+   ```bash
+   curl -X POST "http://localhost:8000/admin/rules" \
+     -H "x-tenant-id: test_tenant" \
+     -H "Content-Type: application/json" \
+     -d '{"rule": "Block password queries", "pattern": ".*password.*", "severity": "high"}'
+   ```
+2. **Send a query that triggers red-flag:**
+   ```bash
+   curl -X POST "http://localhost:8000/agent/message" \
+     -H "Content-Type: application/json" \
+     -d '{"tenant_id": "test_tenant", "message": "What is my password?"}'
+   ```
+3. **Check violations were logged:**
+   ```bash
+   curl -X GET "http://localhost:8000/admin/violations" \
+     -H "x-tenant-id: test_tenant"
+   ```
+4. **Send normal queries and check analytics:**
+   ```bash
+   curl -X POST "http://localhost:8000/agent/message" \
+     -H "Content-Type: application/json" \
+     -d '{"tenant_id": "test_tenant", "message": "What is the company policy?"}'
+   curl -X GET "http://localhost:8000/analytics/overview" \
+     -H "x-tenant-id: test_tenant"
+   ```
+5. **Use debug endpoint to see reasoning:**
+   ```bash
+   curl -X POST "http://localhost:8000/agent/debug" \
+     -H "Content-Type: application/json" \
+     -d '{"tenant_id": "test_tenant", "message": "What is the company policy?"}'
+   ```
+### Step 4: Verify Database
+Check that data is being stored:
+```bash
+# SQLite databases are in data/ directory
+sqlite3 data/analytics.db "SELECT * FROM tool_usage_events LIMIT 10;"
+sqlite3 data/analytics.db "SELECT * FROM redflag_violations LIMIT 10;"
+sqlite3 data/admin_rules.db "SELECT * FROM admin_rules;"
+```
+## Testing Checklist
+### Analytics Store
+- [ ] Tool usage logging works
+- [ ] Red-flag violations are logged
+- [ ] RAG search events are logged with quality metrics
+- [ ] Agent query events are logged
+- [ ] Stats can be filtered by time
+- [ ] Multiple tenants are isolated
+### Admin Rules
+- [ ] Rules can be added with regex patterns
+- [ ] Severity levels work (low/medium/high/critical)
+- [ ] Rules without pattern use rule text
+- [ ] Disabled rules are not returned
+- [ ] Multiple tenants are isolated
+- [ ] Regex patterns actually match correctly
+### API Endpoints
+- [ ] `/analytics/overview` returns correct data
+- [ ] `/analytics/tool-usage` returns stats
+- [ ] `/analytics/rag-quality` returns metrics
+- [ ] `/admin/rules` accepts regex/severity
+- [ ] `/admin/violations` returns violations
+- [ ] `/admin/tools/logs` returns tool usage
+- [ ] `/agent/debug` returns reasoning trace
+- [ ] `/agent/plan` returns tool selection plan
+- [ ] Missing tenant_id returns 400
+### Integration
+- [ ] Agent orchestrator logs to analytics
+- [ ] Red-flag detector logs violations
+- [ ] Tool calls are tracked
+- [ ] Multi-step workflows are logged
+- [ ] Errors are logged correctly
+## Common Issues
+### Database Not Found
+- Ensure `data/` directory exists
+- Analytics store will create it automatically
+### Tests Fail Due to Missing Services
+- Some tests require MCP servers or LLM to be running
+- Mock these services or skip tests if services unavailable
+- Unit tests should work without external services
+### Import Errors
+- Ensure you're running from project root
+- Check that `backend/` is in Python path
+- Install all dependencies: `pip install -r requirements.txt`
+## Performance Testing
+For large-scale testing:
+```python
+# Load test analytics store
+from backend.api.storage.analytics_store import AnalyticsStore
+import time
+store = AnalyticsStore()
+tenant_id = "load_test_tenant"
+start = time.time()
+for i in range(1000):
+    store.log_tool_usage(tenant_id, "rag", latency_ms=100 + i % 50)
+elapsed = time.time() - start
+print(f"Logged 1000 events in {elapsed:.2f}s ({1000/elapsed:.0f} events/sec)")
+# Query performance
+start = time.time()
+stats = store.get_tool_usage_stats(tenant_id)
+elapsed = time.time() - start
+print(f"Query took {elapsed*1000:.2f}ms")
+```
+## Next Steps
+1. **Add more test cases** for edge cases
+2. **Set up CI/CD** to run tests automatically
+3. **Add performance benchmarks** for analytics queries
+4. **Create integration test suite** that spins up all services
+5. **Add E2E tests** using Playwright or Selenium for frontend
+For questions or issues, check the test files in `backend/tests/` or refer to the main README.md.

backend/api/routes/admin.py CHANGED Viewed

@@ -1,16 +1,23 @@
-from fastapi import APIRouter, Header, HTTPException
 from pydantic import BaseModel
-from typing import List, Optional
 from backend.api.storage.rules_store import RulesStore
 router = APIRouter()
 rules_store = RulesStore()
 class RulePayload(BaseModel):
     rule: str
 class BulkRulePayload(BaseModel):
@@ -23,19 +30,31 @@ def get_rules_for_tenant(tenant_id: str) -> List[str]:
 @router.get("/rules")
 async def get_redflag_rules(
-    x_tenant_id: str = Header(None)
 ):
     """
     Returns all red-flag rules for this tenant.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
-    return {
-        "tenant_id": x_tenant_id,
-        "rules": get_rules_for_tenant(x_tenant_id)
-    }
 @router.post("/rules")
@@ -45,8 +64,9 @@ async def add_redflag_rule(
     x_tenant_id: str = Header(None)
 ):
     """
-    Adds a new red-flag rule to this tenant.
-    Accepts either JSON body {"rule": "..."} or query parameter ?rule=...
     """
     if not x_tenant_id:
@@ -60,12 +80,32 @@ async def add_redflag_rule(
     if not rule_value:
         raise HTTPException(status_code=400, detail="Rule cannot be empty")
-    rules_store.add_rule(x_tenant_id, rule_value)
     rules = get_rules_for_tenant(x_tenant_id)
     return {
         "tenant_id": x_tenant_id,
         "added_rule": rule_value,
         "rules": rules
     }
@@ -118,3 +158,109 @@ async def delete_redflag_rule(
         "deleted_rule": rule,
         "rules": rules
     }

+from fastapi import APIRouter, Header, HTTPException, Query
 from pydantic import BaseModel
+from typing import List, Optional, Dict, Any
+from datetime import datetime, timedelta
 from backend.api.storage.rules_store import RulesStore
+from backend.api.storage.analytics_store import AnalyticsStore
 router = APIRouter()
 rules_store = RulesStore()
+analytics_store = AnalyticsStore()
 class RulePayload(BaseModel):
     rule: str
+    pattern: Optional[str] = None  # Regex pattern
+    severity: Optional[str] = "medium"  # low, medium, high, critical
+    description: Optional[str] = None
+    enabled: Optional[bool] = True
 class BulkRulePayload(BaseModel):
 @router.get("/rules")
 async def get_redflag_rules(
+    x_tenant_id: str = Header(None),
+    detailed: bool = Query(False, description="Return full rule metadata including pattern and severity")
 ):
     """
     Returns all red-flag rules for this tenant.
+    Set detailed=true to get full metadata including regex patterns and severity levels.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
+    if detailed:
+        rules = rules_store.get_rules_detailed(x_tenant_id)
+        return {
+            "tenant_id": x_tenant_id,
+            "rules": rules,
+            "count": len(rules)
+        }
+    else:
+        rules = get_rules_for_tenant(x_tenant_id)
+        return {
+            "tenant_id": x_tenant_id,
+            "rules": rules,
+            "count": len(rules)
+        }
 @router.post("/rules")
     x_tenant_id: str = Header(None)
 ):
     """
+    Adds a new red-flag rule to this tenant with optional regex pattern and severity.
+    Accepts either JSON body or query parameter ?rule=...
+    JSON body supports: rule, pattern (regex), severity (low/medium/high/critical), description, enabled
     """
     if not x_tenant_id:
     if not rule_value:
         raise HTTPException(status_code=400, detail="Rule cannot be empty")
+    # Extract optional parameters if payload provided
+    pattern = payload.pattern if payload else None
+    severity = payload.severity if payload else "medium"
+    description = payload.description if payload else None
+    enabled = payload.enabled if payload else True
+    # Validate severity
+    if severity not in ["low", "medium", "high", "critical"]:
+        severity = "medium"
+    rules_store.add_rule(
+        x_tenant_id,
+        rule_value,
+        pattern=pattern,
+        severity=severity,
+        description=description,
+        enabled=enabled
+    )
     rules = get_rules_for_tenant(x_tenant_id)
     return {
         "tenant_id": x_tenant_id,
         "added_rule": rule_value,
+        "pattern": pattern or rule_value,
+        "severity": severity,
+        "description": description or rule_value,
         "rules": rules
     }
         "deleted_rule": rule,
         "rules": rules
     }
+@router.get("/violations")
+async def get_violations(
+    x_tenant_id: str = Header(None),
+    limit: int = Query(50, description="Maximum number of violations to return"),
+    days: int = Query(30, description="Number of days to look back")
+):
+    """
+    Returns red-flag violations for this tenant.
+    Includes rule details, severity, confidence, and timestamps.
+    """
+    if not x_tenant_id:
+        raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    violations = analytics_store.get_redflag_violations(x_tenant_id, limit, since_timestamp)
+    # Convert timestamps to ISO format
+    for violation in violations:
+        if "timestamp" in violation:
+            violation["timestamp_iso"] = datetime.fromtimestamp(violation["timestamp"]).isoformat()
+    return {
+        "tenant_id": x_tenant_id,
+        "violations": violations,
+        "count": len(violations),
+        "period_days": days
+    }
+@router.get("/tools/logs")
+async def get_tool_logs(
+    x_tenant_id: str = Header(None),
+    tool_name: Optional[str] = Query(None, description="Filter by tool name (rag, web, admin, llm)"),
+    days: int = Query(7, description="Number of days to look back"),
+    limit: int = Query(100, description="Maximum number of logs to return")
+):
+    """
+    Returns detailed tool usage logs for this tenant.
+    Includes every tool call with timestamp, latency, tokens, and success/error status.
+    """
+    if not x_tenant_id:
+        raise HTTPException(status_code=400, detail="Missing tenant ID")
+    # For now, return aggregated stats. Full log querying would require extending AnalyticsStore
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    tool_stats = analytics_store.get_tool_usage_stats(x_tenant_id, since_timestamp)
+    # Filter by tool if specified
+    if tool_name:
+        tool_stats = {tool_name: tool_stats.get(tool_name)} if tool_name in tool_stats else {}
+    return {
+        "tenant_id": x_tenant_id,
+        "tool_usage": tool_stats,
+        "period_days": days
+    }
+@router.get("/tenants")
+async def list_tenants():
+    """
+    Lists all tenants (placeholder - would need tenant management table).
+    For demo purposes, returns info about available tenant data.
+    """
+    # Placeholder implementation - in production, this would query a tenants table
+    return {
+        "tenants": [],
+        "message": "Tenant management not fully implemented. Use tenant_id in headers for multi-tenant operations."
+    }
+@router.post("/tenants")
+async def create_tenant(
+    tenant_id: str,
+    metadata: Optional[Dict[str, Any]] = None
+):
+    """
+    Creates a new tenant (placeholder - would need tenant management table).
+    """
+    # Placeholder implementation
+    return {
+        "tenant_id": tenant_id,
+        "status": "created",
+        "message": "Tenant management not fully implemented. Tenant IDs are created on first use."
+    }
+@router.delete("/tenants/{tenant_id}")
+async def delete_tenant(tenant_id: str):
+    """
+    Deletes a tenant and all associated data (placeholder).
+    WARNING: This would delete all rules, analytics, and documents for the tenant.
+    """
+    # Placeholder implementation
+    return {
+        "tenant_id": tenant_id,
+        "status": "deleted",
+        "message": "Tenant deletion not fully implemented. This would delete all tenant data."
+    }

backend/api/routes/agent.py CHANGED Viewed

@@ -45,3 +45,92 @@ async def agent_chat(req: ChatRequest):
         temperature=req.temperature
     )
     return await orchestrator.handle(agent_req)

         temperature=req.temperature
     )
     return await orchestrator.handle(agent_req)
+@router.post("/debug")
+async def agent_debug(req: ChatRequest):
+    """
+    Returns detailed debugging information about agent reasoning.
+    Includes intent classification, tool selection, reasoning trace, and tool traces.
+    """
+    agent_req = AgentRequest(
+        tenant_id=req.tenant_id,
+        user_id=req.user_id,
+        message=req.message,
+        conversation_history=req.conversation_history,
+        temperature=req.temperature
+    )
+    response = await orchestrator.handle(agent_req)
+    return {
+        "request": {
+            "tenant_id": req.tenant_id,
+            "user_id": req.user_id,
+            "message": req.message[:200],
+            "temperature": req.temperature
+        },
+        "response": {
+            "text": response.text[:500] + "..." if len(response.text) > 500 else response.text,
+            "decision": response.decision.dict() if response.decision else None,
+            "tool_traces": response.tool_traces,
+            "reasoning_trace": response.reasoning_trace
+        },
+        "debug_info": {
+            "intent": response.reasoning_trace[1].get("intent") if len(response.reasoning_trace) > 1 else None,
+            "tool_selection": next((t for t in response.reasoning_trace if t.get("step") == "tool_selection"), None),
+            "tool_scores": next((t for t in response.reasoning_trace if t.get("step") == "tool_scoring"), None),
+            "redflag_check": next((t for t in response.reasoning_trace if t.get("step") == "redflag_check"), None),
+            "total_steps": len(response.reasoning_trace)
+        }
+    }
+@router.post("/plan")
+async def agent_plan(req: ChatRequest):
+    """
+    Returns only the agent's planning output (tool selection decision).
+    Useful for understanding what tools the agent would use without executing them.
+    """
+    from ..services.intent_classifier import IntentClassifier
+    from ..services.tool_selector import ToolSelector
+    from ..services.tool_scoring import ToolScoringService
+    import os
+    # Create minimal orchestrator components for planning only
+    llm = orchestrator.llm
+    intent_classifier = IntentClassifier(llm_client=llm)
+    tool_selector = ToolSelector(llm_client=llm)
+    tool_scorer = ToolScoringService()
+    # Classify intent
+    intent = await intent_classifier.classify(req.message)
+    # Pre-fetch RAG for context (optional)
+    rag_results = []
+    try:
+        rag_prefetch = await orchestrator.mcp.call_rag(req.tenant_id, req.message)
+        if isinstance(rag_prefetch, dict):
+            rag_results = rag_prefetch.get("results") or rag_prefetch.get("hits") or []
+    except Exception:
+        pass
+    # Score tools
+    tool_scores = tool_scorer.score(req.message, intent, rag_results)
+    # Select tools
+    ctx = {
+        "tenant_id": req.tenant_id,
+        "rag_results": rag_results,
+        "tool_scores": tool_scores
+    }
+    decision = await tool_selector.select(intent, req.message, ctx)
+    return {
+        "tenant_id": req.tenant_id,
+        "message": req.message,
+        "intent": intent,
+        "tool_scores": tool_scores,
+        "plan": decision.dict(),
+        "steps": decision.tool_input.get("steps", []) if decision.tool_input else [],
+        "reason": decision.reason
+    }

backend/api/routes/analytics.py CHANGED Viewed

@@ -1,103 +1,140 @@
-from fastapi import APIRouter, Header, HTTPException
 router = APIRouter()
-# Mock in-memory analytics (replace with Supabase later)
-ANALYTICS_DATA = {
-    "tool_usage": {
-        "rag": 12,
-        "web": 8,
-        "admin": 3
-    },
-    "redflags": [
-        {
-            "tenant": "tenant123",
-            "match": "salary",
-            "message": "get salary data now",
-            "timestamp": "2025-01-14T10:22:00Z"
-        }
-    ],
-    "activity": {
-        "total_queries": 23,
-        "active_users": 4,
-        "last_query": "2025-01-14T10:24:31Z"
-    }
-}
 @router.get("/overview")
 async def analytics_overview(
-    x_tenant_id: str = Header(None)
 ):
     """
     Returns an overview of analytics for the dashboard.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
     return {
         "tenant_id": x_tenant_id,
         "overview": {
-            "total_queries": ANALYTICS_DATA["activity"]["total_queries"],
-            "tool_usage": ANALYTICS_DATA["tool_usage"],
-            "redflag_count": len(ANALYTICS_DATA["redflags"]),
-            "active_users": ANALYTICS_DATA["activity"]["active_users"]
         }
     }
 @router.get("/tool-usage")
 async def analytics_tool_usage(
-    x_tenant_id: str = Header(None)
 ):
     """
-    Returns how often each tool (RAG, Web, Admin) was used.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
     return {
         "tenant_id": x_tenant_id,
-        "tool_usage": ANALYTICS_DATA["tool_usage"]
     }
 @router.get("/redflags")
 async def analytics_redflags(
-    x_tenant_id: str = Header(None)
 ):
     """
     Returns red-flag violations for this tenant.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
-    redflags = [
-        r for r in ANALYTICS_DATA["redflags"]
-        if r["tenant"] == x_tenant_id
-    ]
     return {
         "tenant_id": x_tenant_id,
-        "redflags": redflags
     }
 @router.get("/activity")
 async def analytics_activity(
-    x_tenant_id: str = Header(None)
 ):
     """
     Returns general tenant activity statistics.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
     return {
         "tenant_id": x_tenant_id,
-        "activity": ANALYTICS_DATA["activity"]
     }

+from fastapi import APIRouter, Header, HTTPException, Query
+from typing import Optional
+from datetime import datetime, timedelta
+from ..storage.analytics_store import AnalyticsStore
 router = APIRouter()
+# Initialize analytics store
+analytics_store = AnalyticsStore()
 @router.get("/overview")
 async def analytics_overview(
+    x_tenant_id: str = Header(None),
+    days: int = Query(30, description="Number of days to look back")
 ):
     """
     Returns an overview of analytics for the dashboard.
+    Includes total queries, tool usage, red-flag count, and active users.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    tool_usage = analytics_store.get_tool_usage_stats(x_tenant_id, since_timestamp)
+    activity = analytics_store.get_activity_summary(x_tenant_id, since_timestamp)
+    rag_quality = analytics_store.get_rag_quality_metrics(x_tenant_id, since_timestamp)
     return {
         "tenant_id": x_tenant_id,
         "overview": {
+            "total_queries": activity["total_queries"],
+            "tool_usage": tool_usage,
+            "redflag_count": activity["redflag_count"],
+            "active_users": activity["active_users"],
+            "last_query": activity["last_query"],
+            "rag_quality": rag_quality
         }
     }
 @router.get("/tool-usage")
 async def analytics_tool_usage(
+    x_tenant_id: str = Header(None),
+    days: int = Query(30, description="Number of days to look back")
 ):
     """
+    Returns how often each tool (RAG, Web, Admin, LLM) was used with detailed stats.
+    Includes counts, latency, tokens, and success/error rates.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    tool_usage = analytics_store.get_tool_usage_stats(x_tenant_id, since_timestamp)
     return {
         "tenant_id": x_tenant_id,
+        "tool_usage": tool_usage,
+        "period_days": days
     }
 @router.get("/redflags")
 async def analytics_redflags(
+    x_tenant_id: str = Header(None),
+    limit: int = Query(50, description="Maximum number of violations to return"),
+    days: int = Query(30, description="Number of days to look back")
 ):
     """
     Returns red-flag violations for this tenant.
+    Includes rule details, severity, confidence, and timestamps.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    redflags = analytics_store.get_redflag_violations(x_tenant_id, limit, since_timestamp)
+    # Convert timestamps to ISO format
+    for violation in redflags:
+        if "timestamp" in violation:
+            violation["timestamp_iso"] = datetime.fromtimestamp(violation["timestamp"]).isoformat()
     return {
         "tenant_id": x_tenant_id,
+        "redflags": redflags,
+        "count": len(redflags)
     }
 @router.get("/activity")
 async def analytics_activity(
+    x_tenant_id: str = Header(None),
+    days: int = Query(30, description="Number of days to look back")
 ):
     """
     Returns general tenant activity statistics.
+    Includes total queries, active users, and last query timestamp.
+    """
+    if not x_tenant_id:
+        raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    activity = analytics_store.get_activity_summary(x_tenant_id, since_timestamp)
+    return {
+        "tenant_id": x_tenant_id,
+        "activity": activity,
+        "period_days": days
+    }
+@router.get("/rag-quality")
+async def analytics_rag_quality(
+    x_tenant_id: str = Header(None),
+    days: int = Query(30, description="Number of days to look back")
+):
+    """
+    Returns RAG quality metrics including recall/precision indicators.
+    Includes average hits, scores, and latency.
     """
     if not x_tenant_id:
         raise HTTPException(status_code=400, detail="Missing tenant ID")
+    since_timestamp = int((datetime.now() - timedelta(days=days)).timestamp()) if days else None
+    rag_quality = analytics_store.get_rag_quality_metrics(x_tenant_id, since_timestamp)
     return {
         "tenant_id": x_tenant_id,
+        "rag_quality": rag_quality,
+        "period_days": days
     }

backend/api/services/agent_orchestrator.py CHANGED Viewed

@@ -22,6 +22,8 @@ from .tool_selector import ToolSelector
 from .llm_client import LLMClient
 from ..mcp_clients.mcp_client import MCPClient
 from .tool_scoring import ToolScoringService
 class AgentOrchestrator:
@@ -40,8 +42,10 @@ class AgentOrchestrator:
         self.intent = IntentClassifier(llm_client=self.llm)
         self.selector = ToolSelector(llm_client=self.llm)
         self.tool_scorer = ToolScoringService()
     async def handle(self, req: AgentRequest) -> AgentResponse:
         reasoning_trace: List[Dict[str, Any]] = []
         reasoning_trace.append({
             "step": "request_received",
@@ -58,6 +62,19 @@ class AgentOrchestrator:
             "matches": [m.__dict__ for m in matches]
         })
         if matches:
             # Notify admin asynchronously (do not await blocking the response path if you prefer)
             # we await here to ensure admin receives the alert before responding
@@ -76,6 +93,19 @@ class AgentOrchestrator:
                 f"{m.description or m.pattern} [severity: {m.severity}]"
                 for m in matches
             ) or "Policy violation detected"
             return AgentResponse(
                 text=f"⚠️ Request blocked by Admin Plan: {summary}. Please review your governance rules or contact an administrator.",
                 decision=decision,
@@ -95,16 +125,54 @@ class AgentOrchestrator:
         rag_results = []
         try:
             # Try to pre-fetch RAG to help tool selector make better decisions
             rag_prefetch = await self.mcp.call_rag(req.tenant_id, req.message)
             if isinstance(rag_prefetch, dict):
                 rag_results = rag_prefetch.get("results") or rag_prefetch.get("hits") or []
             reasoning_trace.append({
                 "step": "rag_prefetch",
                 "status": "ok",
-                "hit_count": len(rag_results)
             })
         except Exception as pref_err:
             # If RAG fails, continue without it
             reasoning_trace.append({
                 "step": "rag_prefetch",
                 "status": "error",
@@ -147,58 +215,230 @@ class AgentOrchestrator:
                 )
         # 5) Execute single tool
         if decision.action == "call_tool" and decision.tool:
             try:
                 if decision.tool == "rag":
                     rag_resp = await self.mcp.call_rag(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
                     tool_traces.append({"tool": "rag", "response": rag_resp})
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "rag",
-                        "hit_count": len(self._extract_hits(rag_resp)),
-                        "summary": self._summarize_hits(rag_resp, limit=2)
                     })
                     prompt = self._build_prompt_with_rag(req, rag_resp)
                     llm_out = await self.llm.simple_call(prompt, temperature=req.temperature)
                     reasoning_trace.append({
                         "step": "llm_response",
-                        "mode": "rag_synthesis"
                     })
                     return AgentResponse(text=llm_out, decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "web":
                     web_resp = await self.mcp.call_web(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
                     tool_traces.append({"tool": "web", "response": web_resp})
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "web",
-                        "hit_count": len(self._extract_hits(web_resp)),
-                        "summary": self._summarize_hits(web_resp, limit=2)
                     })
                     prompt = self._build_prompt_with_web(req, web_resp)
                     llm_out = await self.llm.simple_call(prompt, temperature=req.temperature)
                     reasoning_trace.append({
                         "step": "llm_response",
-                        "mode": "web_synthesis"
                     })
                     return AgentResponse(text=llm_out, decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "admin":
                     admin_resp = await self.mcp.call_admin(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
                     tool_traces.append({"tool": "admin", "response": admin_resp})
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "admin",
-                        "status": "completed"
                     })
                     return AgentResponse(text=json.dumps(admin_resp), decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "llm":
                     llm_out = await self.llm.simple_call(req.message, temperature=req.temperature)
                     reasoning_trace.append({
                         "step": "llm_response",
-                        "mode": "direct"
                     })
                     return AgentResponse(text=llm_out, decision=decision, reasoning_trace=reasoning_trace)
             except Exception as e:
@@ -231,7 +471,20 @@ class AgentOrchestrator:
         # Default: direct LLM response
         try:
             llm_out = await self.llm.simple_call(req.message, temperature=req.temperature)
         except Exception as e:
             # If LLM fails, return a helpful error message
             error_msg = str(e)
@@ -247,12 +500,32 @@ class AgentOrchestrator:
                 )
             else:
                 llm_out = f"I apologize, but I'm unable to process your request right now. The AI service is unavailable: {error_msg}"
             reasoning_trace.append({
                 "step": "error",
                 "tool": "llm",
                 "error": str(e)
             })
         return AgentResponse(
             text=llm_out,
             decision=AgentDecision(action="respond", tool=None, tool_input=None, reason="default_llm"),

 from .llm_client import LLMClient
 from ..mcp_clients.mcp_client import MCPClient
 from .tool_scoring import ToolScoringService
+from ..storage.analytics_store import AnalyticsStore
+import time
 class AgentOrchestrator:
         self.intent = IntentClassifier(llm_client=self.llm)
         self.selector = ToolSelector(llm_client=self.llm)
         self.tool_scorer = ToolScoringService()
+        self.analytics = AnalyticsStore()
     async def handle(self, req: AgentRequest) -> AgentResponse:
+        start_time = time.time()
         reasoning_trace: List[Dict[str, Any]] = []
         reasoning_trace.append({
             "step": "request_received",
             "matches": [m.__dict__ for m in matches]
         })
+        # Log red-flag violations
+        for match in matches:
+            self.analytics.log_redflag_violation(
+                tenant_id=req.tenant_id,
+                rule_id=match.rule_id,
+                rule_pattern=match.pattern,
+                severity=match.severity,
+                matched_text=match.matched_text,
+                confidence=match.confidence,
+                message_preview=req.message[:200],
+                user_id=req.user_id
+            )
         if matches:
             # Notify admin asynchronously (do not await blocking the response path if you prefer)
             # we await here to ensure admin receives the alert before responding
                 f"{m.description or m.pattern} [severity: {m.severity}]"
                 for m in matches
             ) or "Policy violation detected"
+            total_latency_ms = int((time.time() - start_time) * 1000)
+            self.analytics.log_agent_query(
+                tenant_id=req.tenant_id,
+                message_preview=req.message[:200],
+                intent="admin",
+                tools_used=["admin"],
+                total_tokens=0,
+                total_latency_ms=total_latency_ms,
+                success=False,
+                user_id=req.user_id
+            )
             return AgentResponse(
                 text=f"⚠️ Request blocked by Admin Plan: {summary}. Please review your governance rules or contact an administrator.",
                 decision=decision,
         rag_results = []
         try:
             # Try to pre-fetch RAG to help tool selector make better decisions
+            rag_start = time.time()
             rag_prefetch = await self.mcp.call_rag(req.tenant_id, req.message)
+            rag_latency_ms = int((time.time() - rag_start) * 1000)
             if isinstance(rag_prefetch, dict):
                 rag_results = rag_prefetch.get("results") or rag_prefetch.get("hits") or []
+                # Log RAG search event
+                hits_count = len(rag_results)
+                avg_score = None
+                top_score = None
+                if rag_results:
+                    scores = [h.get("score", 0.0) for h in rag_results if isinstance(h, dict) and "score" in h]
+                    if scores:
+                        avg_score = sum(scores) / len(scores)
+                        top_score = max(scores)
+                self.analytics.log_rag_search(
+                    tenant_id=req.tenant_id,
+                    query=req.message[:500],
+                    hits_count=hits_count,
+                    avg_score=avg_score,
+                    top_score=top_score,
+                    latency_ms=rag_latency_ms
+                )
+                # Log tool usage
+                self.analytics.log_tool_usage(
+                    tenant_id=req.tenant_id,
+                    tool_name="rag",
+                    latency_ms=rag_latency_ms,
+                    success=True,
+                    user_id=req.user_id
+                )
             reasoning_trace.append({
                 "step": "rag_prefetch",
                 "status": "ok",
+                "hit_count": len(rag_results),
+                "latency_ms": rag_latency_ms
             })
         except Exception as pref_err:
             # If RAG fails, continue without it
+            rag_latency_ms = 0  # 0 for failed
+            self.analytics.log_tool_usage(
+                tenant_id=req.tenant_id,
+                tool_name="rag",
+                latency_ms=rag_latency_ms,
+                success=False,
+                error_message=str(pref_err)[:200],
+                user_id=req.user_id
+            )
             reasoning_trace.append({
                 "step": "rag_prefetch",
                 "status": "error",
                 )
         # 5) Execute single tool
+        tools_used = []
+        total_tokens = 0
         if decision.action == "call_tool" and decision.tool:
             try:
                 if decision.tool == "rag":
+                    rag_start = time.time()
                     rag_resp = await self.mcp.call_rag(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
+                    rag_latency_ms = int((time.time() - rag_start) * 1000)
+                    tools_used.append("rag")
                     tool_traces.append({"tool": "rag", "response": rag_resp})
+                    hits = self._extract_hits(rag_resp)
+                    # Log RAG search and tool usage
+                    hits_count = len(hits)
+                    avg_score = None
+                    top_score = None
+                    if hits:
+                        scores = [h.get("score", 0.0) for h in hits if isinstance(h, dict) and "score" in h]
+                        if scores:
+                            avg_score = sum(scores) / len(scores)
+                            top_score = max(scores)
+                    self.analytics.log_rag_search(
+                        tenant_id=req.tenant_id,
+                        query=req.message[:500],
+                        hits_count=hits_count,
+                        avg_score=avg_score,
+                        top_score=top_score,
+                        latency_ms=rag_latency_ms
+                    )
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="rag",
+                        latency_ms=rag_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "rag",
+                        "hit_count": hits_count,
+                        "summary": self._summarize_hits(rag_resp, limit=2),
+                        "latency_ms": rag_latency_ms
                     })
                     prompt = self._build_prompt_with_rag(req, rag_resp)
+                    llm_start = time.time()
                     llm_out = await self.llm.simple_call(prompt, temperature=req.temperature)
+                    llm_latency_ms = int((time.time() - llm_start) * 1000)
+                    tools_used.append("llm")
+                    # Estimate tokens (rough: ~4 chars per token)
+                    estimated_tokens = len(llm_out) // 4 + len(prompt) // 4
+                    total_tokens += estimated_tokens
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="llm",
+                        latency_ms=llm_latency_ms,
+                        tokens_used=estimated_tokens,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     reasoning_trace.append({
                         "step": "llm_response",
+                        "mode": "rag_synthesis",
+                        "latency_ms": llm_latency_ms,
+                        "estimated_tokens": estimated_tokens
                     })
+                    total_latency_ms = int((time.time() - start_time) * 1000)
+                    self.analytics.log_agent_query(
+                        tenant_id=req.tenant_id,
+                        message_preview=req.message[:200],
+                        intent=intent,
+                        tools_used=tools_used,
+                        total_tokens=total_tokens,
+                        total_latency_ms=total_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     return AgentResponse(text=llm_out, decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "web":
+                    web_start = time.time()
                     web_resp = await self.mcp.call_web(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
+                    web_latency_ms = int((time.time() - web_start) * 1000)
+                    tools_used.append("web")
                     tool_traces.append({"tool": "web", "response": web_resp})
+                    hits_count = len(self._extract_hits(web_resp))
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="web",
+                        latency_ms=web_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "web",
+                        "hit_count": hits_count,
+                        "summary": self._summarize_hits(web_resp, limit=2),
+                        "latency_ms": web_latency_ms
                     })
                     prompt = self._build_prompt_with_web(req, web_resp)
+                    llm_start = time.time()
                     llm_out = await self.llm.simple_call(prompt, temperature=req.temperature)
+                    llm_latency_ms = int((time.time() - llm_start) * 1000)
+                    tools_used.append("llm")
+                    estimated_tokens = len(llm_out) // 4 + len(prompt) // 4
+                    total_tokens += estimated_tokens
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="llm",
+                        latency_ms=llm_latency_ms,
+                        tokens_used=estimated_tokens,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     reasoning_trace.append({
                         "step": "llm_response",
+                        "mode": "web_synthesis",
+                        "latency_ms": llm_latency_ms,
+                        "estimated_tokens": estimated_tokens
                     })
+                    total_latency_ms = int((time.time() - start_time) * 1000)
+                    self.analytics.log_agent_query(
+                        tenant_id=req.tenant_id,
+                        message_preview=req.message[:200],
+                        intent=intent,
+                        tools_used=tools_used,
+                        total_tokens=total_tokens,
+                        total_latency_ms=total_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     return AgentResponse(text=llm_out, decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "admin":
+                    admin_start = time.time()
                     admin_resp = await self.mcp.call_admin(req.tenant_id, decision.tool_input.get("query") if decision.tool_input else req.message)
+                    admin_latency_ms = int((time.time() - admin_start) * 1000)
+                    tools_used.append("admin")
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="admin",
+                        latency_ms=admin_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     tool_traces.append({"tool": "admin", "response": admin_resp})
                     reasoning_trace.append({
                         "step": "tool_execution",
                         "tool": "admin",
+                        "status": "completed",
+                        "latency_ms": admin_latency_ms
                     })
+                    total_latency_ms = int((time.time() - start_time) * 1000)
+                    self.analytics.log_agent_query(
+                        tenant_id=req.tenant_id,
+                        message_preview=req.message[:200],
+                        intent=intent,
+                        tools_used=tools_used,
+                        total_tokens=0,
+                        total_latency_ms=total_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     return AgentResponse(text=json.dumps(admin_resp), decision=decision, tool_traces=tool_traces, reasoning_trace=reasoning_trace)
                 if decision.tool == "llm":
+                    llm_start = time.time()
                     llm_out = await self.llm.simple_call(req.message, temperature=req.temperature)
+                    llm_latency_ms = int((time.time() - llm_start) * 1000)
+                    tools_used.append("llm")
+                    estimated_tokens = len(llm_out) // 4 + len(req.message) // 4
+                    total_tokens += estimated_tokens
+                    self.analytics.log_tool_usage(
+                        tenant_id=req.tenant_id,
+                        tool_name="llm",
+                        latency_ms=llm_latency_ms,
+                        tokens_used=estimated_tokens,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     reasoning_trace.append({
                         "step": "llm_response",
+                        "mode": "direct",
+                        "latency_ms": llm_latency_ms,
+                        "estimated_tokens": estimated_tokens
                     })
+                    total_latency_ms = int((time.time() - start_time) * 1000)
+                    self.analytics.log_agent_query(
+                        tenant_id=req.tenant_id,
+                        message_preview=req.message[:200],
+                        intent=intent,
+                        tools_used=tools_used,
+                        total_tokens=total_tokens,
+                        total_latency_ms=total_latency_ms,
+                        success=True,
+                        user_id=req.user_id
+                    )
                     return AgentResponse(text=llm_out, decision=decision, reasoning_trace=reasoning_trace)
             except Exception as e:
         # Default: direct LLM response
         try:
+            llm_start = time.time()
             llm_out = await self.llm.simple_call(req.message, temperature=req.temperature)
+            llm_latency_ms = int((time.time() - llm_start) * 1000)
+            tools_used = ["llm"]
+            estimated_tokens = len(llm_out) // 4 + len(req.message) // 4
+            self.analytics.log_tool_usage(
+                tenant_id=req.tenant_id,
+                tool_name="llm",
+                latency_ms=llm_latency_ms,
+                tokens_used=estimated_tokens,
+                success=True,
+                user_id=req.user_id
+            )
         except Exception as e:
             # If LLM fails, return a helpful error message
             error_msg = str(e)
                 )
             else:
                 llm_out = f"I apologize, but I'm unable to process your request right now. The AI service is unavailable: {error_msg}"
+            self.analytics.log_tool_usage(
+                tenant_id=req.tenant_id,
+                tool_name="llm",
+                success=False,
+                error_message=error_msg[:200],
+                user_id=req.user_id
+            )
             reasoning_trace.append({
                 "step": "error",
                 "tool": "llm",
                 "error": str(e)
             })
+        total_latency_ms = int((time.time() - start_time) * 1000)
+        self.analytics.log_agent_query(
+            tenant_id=req.tenant_id,
+            message_preview=req.message[:200],
+            intent=intent,
+            tools_used=tools_used if 'tools_used' in locals() else [],
+            total_tokens=estimated_tokens if 'estimated_tokens' in locals() else 0,
+            total_latency_ms=total_latency_ms,
+            success=True if 'llm_out' in locals() else False,
+            user_id=req.user_id
+        )
         return AgentResponse(
             text=llm_out,
             decision=AgentDecision(action="respond", tool=None, tool_input=None, reason="default_llm"),

backend/api/storage/analytics_store.py ADDED Viewed

	@@ -0,0 +1,401 @@

+"""
+Analytics Store for tenant-level analytics logging
+Tracks:
+- Tool usage (RAG, Web, Admin, LLM)
+- LLM token counts and latency
+- RAG recall/precision indicators
+- Red-flag violations
+- Per-tenant query volume
+"""
+import sqlite3
+import json
+import time
+from pathlib import Path
+from typing import List, Dict, Any, Optional
+from datetime import datetime
+class AnalyticsStore:
+    """
+    SQLite-backed store for analytics logging.
+    Provides tenant-level analytics for tool usage, tokens, latency, and violations.
+    """
+    def __init__(self, db_path: Optional[str] = None):
+        if db_path is None:
+            root_dir = Path(__file__).resolve().parents[3]
+            data_dir = root_dir / "data"
+            data_dir.mkdir(parents=True, exist_ok=True)
+            self.db_path = data_dir / "analytics.db"
+        else:
+            self.db_path = Path(db_path)
+        self._init_db()
+    def _init_db(self):
+        """Initialize database tables for analytics."""
+        with sqlite3.connect(self.db_path) as conn:
+            # Tool usage events table
+            conn.execute("""
+                CREATE TABLE IF NOT EXISTS tool_usage_events (
+                    id INTEGER PRIMARY KEY AUTOINCREMENT,
+                    tenant_id TEXT NOT NULL,
+                    user_id TEXT,
+                    tool_name TEXT NOT NULL,
+                    timestamp INTEGER NOT NULL,
+                    latency_ms INTEGER,
+                    tokens_used INTEGER,
+                    success BOOLEAN DEFAULT 1,
+                    error_message TEXT,
+                    metadata TEXT
+                )
+            """)
+            # Red-flag violations table
+            conn.execute("""
+                CREATE TABLE IF NOT EXISTS redflag_violations (
+                    id INTEGER PRIMARY KEY AUTOINCREMENT,
+                    tenant_id TEXT NOT NULL,
+                    user_id TEXT,
+                    rule_id TEXT NOT NULL,
+                    rule_pattern TEXT,
+                    severity TEXT NOT NULL,
+                    matched_text TEXT,
+                    confidence REAL,
+                    message_preview TEXT,
+                    timestamp INTEGER NOT NULL
+                )
+            """)
+            # RAG search events with quality metrics
+            conn.execute("""
+                CREATE TABLE IF NOT EXISTS rag_search_events (
+                    id INTEGER PRIMARY KEY AUTOINCREMENT,
+                    tenant_id TEXT NOT NULL,
+                    query TEXT NOT NULL,
+                    hits_count INTEGER,
+                    avg_score REAL,
+                    top_score REAL,
+                    timestamp INTEGER NOT NULL,
+                    latency_ms INTEGER
+                )
+            """)
+            # Agent query events (overall query tracking)
+            conn.execute("""
+                CREATE TABLE IF NOT EXISTS agent_query_events (
+                    id INTEGER PRIMARY KEY AUTOINCREMENT,
+                    tenant_id TEXT NOT NULL,
+                    user_id TEXT,
+                    message_preview TEXT,
+                    intent TEXT,
+                    tools_used TEXT,
+                    total_tokens INTEGER,
+                    total_latency_ms INTEGER,
+                    success BOOLEAN DEFAULT 1,
+                    timestamp INTEGER NOT NULL
+                )
+            """)
+            # Create indexes separately (SQLite doesn't support inline INDEX in CREATE TABLE)
+            conn.execute("""
+                CREATE INDEX IF NOT EXISTS idx_tool_usage_tenant_timestamp
+                ON tool_usage_events(tenant_id, timestamp)
+            """)
+            conn.execute("""
+                CREATE INDEX IF NOT EXISTS idx_redflag_tenant_timestamp
+                ON redflag_violations(tenant_id, timestamp)
+            """)
+            conn.execute("""
+                CREATE INDEX IF NOT EXISTS idx_rag_search_tenant_timestamp
+                ON rag_search_events(tenant_id, timestamp)
+            """)
+            conn.execute("""
+                CREATE INDEX IF NOT EXISTS idx_agent_query_tenant_timestamp
+                ON agent_query_events(tenant_id, timestamp)
+            """)
+            conn.commit()
+    def log_tool_usage(
+        self,
+        tenant_id: str,
+        tool_name: str,
+        latency_ms: Optional[int] = None,
+        tokens_used: Optional[int] = None,
+        success: bool = True,
+        error_message: Optional[str] = None,
+        metadata: Optional[Dict[str, Any]] = None,
+        user_id: Optional[str] = None
+    ):
+        """Log a tool usage event."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.execute("""
+                INSERT INTO tool_usage_events
+                (tenant_id, user_id, tool_name, timestamp, latency_ms, tokens_used, success, error_message, metadata)
+                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
+            """, (
+                tenant_id,
+                user_id,
+                tool_name,
+                int(time.time()),
+                latency_ms,
+                tokens_used,
+                1 if success else 0,
+                error_message,
+                json.dumps(metadata) if metadata else None
+            ))
+            conn.commit()
+    def log_redflag_violation(
+        self,
+        tenant_id: str,
+        rule_id: str,
+        rule_pattern: str,
+        severity: str,
+        matched_text: str,
+        confidence: Optional[float] = None,
+        message_preview: Optional[str] = None,
+        user_id: Optional[str] = None
+    ):
+        """Log a red-flag violation."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.execute("""
+                INSERT INTO redflag_violations
+                (tenant_id, user_id, rule_id, rule_pattern, severity, matched_text, confidence, message_preview, timestamp)
+                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
+            """, (
+                tenant_id,
+                user_id,
+                rule_id,
+                rule_pattern,
+                severity,
+                matched_text,
+                confidence,
+                message_preview[:200] if message_preview else None,
+                int(time.time())
+            ))
+            conn.commit()
+    def log_rag_search(
+        self,
+        tenant_id: str,
+        query: str,
+        hits_count: int,
+        avg_score: Optional[float] = None,
+        top_score: Optional[float] = None,
+        latency_ms: Optional[int] = None
+    ):
+        """Log a RAG search event with quality metrics."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.execute("""
+                INSERT INTO rag_search_events
+                (tenant_id, query, hits_count, avg_score, top_score, timestamp, latency_ms)
+                VALUES (?, ?, ?, ?, ?, ?, ?)
+            """, (
+                tenant_id,
+                query[:500],  # Limit query length
+                hits_count,
+                avg_score,
+                top_score,
+                int(time.time()),
+                latency_ms
+            ))
+            conn.commit()
+    def log_agent_query(
+        self,
+        tenant_id: str,
+        message_preview: str,
+        intent: Optional[str] = None,
+        tools_used: Optional[List[str]] = None,
+        total_tokens: Optional[int] = None,
+        total_latency_ms: Optional[int] = None,
+        success: bool = True,
+        user_id: Optional[str] = None
+    ):
+        """Log an agent query event (overall query tracking)."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.execute("""
+                INSERT INTO agent_query_events
+                (tenant_id, user_id, message_preview, intent, tools_used, total_tokens, total_latency_ms, success, timestamp)
+                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
+            """, (
+                tenant_id,
+                user_id,
+                message_preview[:200],
+                intent,
+                json.dumps(tools_used) if tools_used else None,
+                total_tokens,
+                total_latency_ms,
+                1 if success else 0,
+                int(time.time())
+            ))
+            conn.commit()
+    def get_tool_usage_stats(
+        self,
+        tenant_id: str,
+        since_timestamp: Optional[int] = None
+    ) -> Dict[str, Any]:
+        """Get tool usage statistics for a tenant."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.row_factory = sqlite3.Row
+            query = """
+                SELECT
+                    tool_name,
+                    COUNT(*) as count,
+                    AVG(latency_ms) as avg_latency_ms,
+                    SUM(tokens_used) as total_tokens,
+                    SUM(CASE WHEN success = 1 THEN 1 ELSE 0 END) as success_count
+                FROM tool_usage_events
+                WHERE tenant_id = ?
+            """
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            query += " GROUP BY tool_name"
+            cursor = conn.execute(query, params)
+            rows = cursor.fetchall()
+            stats = {}
+            for row in rows:
+                tool_name = row["tool_name"]
+                stats[tool_name] = {
+                    "count": row["count"],
+                    "avg_latency_ms": round(row["avg_latency_ms"] or 0, 2),
+                    "total_tokens": row["total_tokens"] or 0,
+                    "success_count": row["success_count"],
+                    "error_count": row["count"] - row["success_count"]
+                }
+            return stats
+    def get_redflag_violations(
+        self,
+        tenant_id: str,
+        limit: int = 50,
+        since_timestamp: Optional[int] = None
+    ) -> List[Dict[str, Any]]:
+        """Get recent red-flag violations for a tenant."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.row_factory = sqlite3.Row
+            query = """
+                SELECT * FROM redflag_violations
+                WHERE tenant_id = ?
+            """
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            query += " ORDER BY timestamp DESC LIMIT ?"
+            params.append(limit)
+            cursor = conn.execute(query, params)
+            rows = cursor.fetchall()
+            return [dict(row) for row in rows]
+    def get_activity_summary(
+        self,
+        tenant_id: str,
+        since_timestamp: Optional[int] = None
+    ) -> Dict[str, Any]:
+        """Get activity summary for a tenant."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.row_factory = sqlite3.Row
+            # Total queries
+            query = "SELECT COUNT(*) as total FROM agent_query_events WHERE tenant_id = ?"
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            total_queries = conn.execute(query, params).fetchone()["total"]
+            # Active users (unique user_ids in the period)
+            query = """
+                SELECT COUNT(DISTINCT user_id) as active_users
+                FROM agent_query_events
+                WHERE tenant_id = ? AND user_id IS NOT NULL
+            """
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            active_users = conn.execute(query, params).fetchone()["active_users"]
+            # Last query timestamp
+            query = """
+                SELECT MAX(timestamp) as last_query
+                FROM agent_query_events
+                WHERE tenant_id = ?
+            """
+            last_query_ts = conn.execute(query, [tenant_id]).fetchone()["last_query"]
+            # Red-flag count
+            query = "SELECT COUNT(*) as count FROM redflag_violations WHERE tenant_id = ?"
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            redflag_count = conn.execute(query, params).fetchone()["count"]
+            return {
+                "total_queries": total_queries,
+                "active_users": active_users or 0,
+                "redflag_count": redflag_count,
+                "last_query": datetime.fromtimestamp(last_query_ts).isoformat() if last_query_ts else None
+            }
+    def get_rag_quality_metrics(
+        self,
+        tenant_id: str,
+        since_timestamp: Optional[int] = None
+    ) -> Dict[str, Any]:
+        """Get RAG quality metrics (recall/precision indicators)."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.row_factory = sqlite3.Row
+            query = """
+                SELECT
+                    COUNT(*) as total_searches,
+                    AVG(hits_count) as avg_hits,
+                    AVG(avg_score) as avg_avg_score,
+                    AVG(top_score) as avg_top_score,
+                    AVG(latency_ms) as avg_latency_ms
+                FROM rag_search_events
+                WHERE tenant_id = ?
+            """
+            params = [tenant_id]
+            if since_timestamp:
+                query += " AND timestamp >= ?"
+                params.append(since_timestamp)
+            row = conn.execute(query, params).fetchone()
+            return {
+                "total_searches": row["total_searches"] or 0,
+                "avg_hits_per_search": round(row["avg_hits"] or 0, 2),
+                "avg_score": round(row["avg_avg_score"] or 0, 3),
+                "avg_top_score": round(row["avg_top_score"] or 0, 3),
+                "avg_latency_ms": round(row["avg_latency_ms"] or 0, 2)
+            }

backend/api/storage/rules_store.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import sqlite3
 from pathlib import Path
-from typing import List
 class RulesStore:
@@ -18,32 +19,90 @@ class RulesStore:
     def _init_db(self):
         with sqlite3.connect(self.db_path) as conn:
             conn.execute(
                 """
                 CREATE TABLE IF NOT EXISTS admin_rules (
                     id INTEGER PRIMARY KEY AUTOINCREMENT,
                     tenant_id TEXT NOT NULL,
                     rule TEXT NOT NULL,
                     UNIQUE(tenant_id, rule)
                 )
                 """
             )
             conn.commit()
     def get_rules(self, tenant_id: str) -> List[str]:
         with sqlite3.connect(self.db_path) as conn:
             cursor = conn.execute(
-                "SELECT rule FROM admin_rules WHERE tenant_id = ? ORDER BY id ASC",
                 (tenant_id,),
             )
             return [row[0] for row in cursor.fetchall()]
-    def add_rule(self, tenant_id: str, rule: str) -> bool:
         try:
             with sqlite3.connect(self.db_path) as conn:
                 conn.execute(
-                    "INSERT OR IGNORE INTO admin_rules (tenant_id, rule) VALUES (?, ?)",
-                    (tenant_id, rule),
                 )
                 conn.commit()
             return True

 import sqlite3
+import time
 from pathlib import Path
+from typing import List, Optional, Dict, Any
 class RulesStore:
     def _init_db(self):
         with sqlite3.connect(self.db_path) as conn:
+            # Create table with regex pattern and severity support
             conn.execute(
                 """
                 CREATE TABLE IF NOT EXISTS admin_rules (
                     id INTEGER PRIMARY KEY AUTOINCREMENT,
                     tenant_id TEXT NOT NULL,
                     rule TEXT NOT NULL,
+                    pattern TEXT,
+                    severity TEXT DEFAULT 'medium',
+                    description TEXT,
+                    enabled BOOLEAN DEFAULT 1,
+                    created_at INTEGER,
                     UNIQUE(tenant_id, rule)
                 )
                 """
             )
+            # Add new columns if they don't exist (for backward compatibility)
+            try:
+                conn.execute("ALTER TABLE admin_rules ADD COLUMN pattern TEXT")
+            except sqlite3.OperationalError:
+                pass  # Column already exists
+            try:
+                conn.execute("ALTER TABLE admin_rules ADD COLUMN severity TEXT DEFAULT 'medium'")
+            except sqlite3.OperationalError:
+                pass
+            try:
+                conn.execute("ALTER TABLE admin_rules ADD COLUMN description TEXT")
+            except sqlite3.OperationalError:
+                pass
+            try:
+                conn.execute("ALTER TABLE admin_rules ADD COLUMN enabled BOOLEAN DEFAULT 1")
+            except sqlite3.OperationalError:
+                pass
+            try:
+                conn.execute("ALTER TABLE admin_rules ADD COLUMN created_at INTEGER")
+            except sqlite3.OperationalError:
+                pass
             conn.commit()
     def get_rules(self, tenant_id: str) -> List[str]:
+        """Get all rules as a list of rule text strings (backward compatibility)."""
         with sqlite3.connect(self.db_path) as conn:
             cursor = conn.execute(
+                "SELECT rule FROM admin_rules WHERE tenant_id = ? AND enabled = 1 ORDER BY id ASC",
                 (tenant_id,),
             )
             return [row[0] for row in cursor.fetchall()]
+    def get_rules_detailed(self, tenant_id: str) -> List[Dict[str, Any]]:
+        """Get all rules with full metadata including pattern, severity, etc."""
+        with sqlite3.connect(self.db_path) as conn:
+            conn.row_factory = sqlite3.Row
+            cursor = conn.execute(
+                """SELECT id, tenant_id, rule, pattern, severity, description, enabled, created_at
+                FROM admin_rules WHERE tenant_id = ? AND enabled = 1 ORDER BY id ASC""",
+                (tenant_id,),
+            )
+            rows = cursor.fetchall()
+            return [dict(row) for row in rows]
+    def add_rule(
+        self,
+        tenant_id: str,
+        rule: str,
+        pattern: Optional[str] = None,
+        severity: str = "medium",
+        description: Optional[str] = None,
+        enabled: bool = True
+    ) -> bool:
+        """
+        Add a rule with optional regex pattern and severity.
+        If pattern is None, the rule text itself is used as the pattern.
+        """
         try:
             with sqlite3.connect(self.db_path) as conn:
+                # If pattern not provided, use rule text as pattern
+                pattern_value = pattern or rule
+                description_value = description or rule
                 conn.execute(
+                    """INSERT OR IGNORE INTO admin_rules
+                    (tenant_id, rule, pattern, severity, description, enabled, created_at)
+                    VALUES (?, ?, ?, ?, ?, ?, ?)""",
+                    (tenant_id, rule, pattern_value, severity, description_value, 1 if enabled else 0, int(time.time())),
                 )
                 conn.commit()
             return True

backend/mcp_servers/database.py CHANGED Viewed

@@ -135,15 +135,24 @@ def insert_document_chunks(tenant_id: str, text: str, embedding: list):
 def search_vectors(tenant_id: str, vector: list, limit: int = 5) -> List[Dict[str, Any]]:
     """
     Perform semantic vector search using pgvector.
     """
     try:
         conn = get_connection()
         cur = conn.cursor(cursor_factory=psycopg2.extras.DictCursor)
         cur.execute(
             """
             SELECT
                 chunk_text,
                 1 - (embedding <=> %s::vector(384)) AS similarity
             FROM documents
             WHERE tenant_id = %s
@@ -155,21 +164,30 @@ def search_vectors(tenant_id: str, vector: list, limit: int = 5) -> List[Dict[st
         rows = cur.fetchall()
-        cur.close()
-        conn.close()
         results: List[Dict[str, Any]] = []
         for row in rows:
             results.append(
                 {
                     "text": row["chunk_text"],
                     "similarity": float(row.get("similarity", 0.0)),
                 }
             )
         return results
     except Exception as e:
-        print("DB SEARCH ERROR:", e)
         return []

 def search_vectors(tenant_id: str, vector: list, limit: int = 5) -> List[Dict[str, Any]]:
     """
     Perform semantic vector search using pgvector.
+    Results are filtered by tenant_id to ensure data isolation.
     """
     try:
+        # Validate tenant_id
+        if not tenant_id or not tenant_id.strip():
+            print("DB SEARCH ERROR: tenant_id is empty")
+            return []
+        tenant_id = tenant_id.strip()
         conn = get_connection()
         cur = conn.cursor(cursor_factory=psycopg2.extras.DictCursor)
+        # Query with explicit tenant_id filtering
         cur.execute(
             """
             SELECT
                 chunk_text,
+                tenant_id,
                 1 - (embedding <=> %s::vector(384)) AS similarity
             FROM documents
             WHERE tenant_id = %s
         rows = cur.fetchall()
+        # Verify all results belong to the requested tenant (safety check)
         results: List[Dict[str, Any]] = []
         for row in rows:
+            row_tenant_id = row.get("tenant_id", "")
+            if row_tenant_id != tenant_id:
+                print(f"WARNING: Found document with tenant_id '{row_tenant_id}' when searching for '{tenant_id}' - skipping")
+                continue
             results.append(
                 {
                     "text": row["chunk_text"],
                     "similarity": float(row.get("similarity", 0.0)),
                 }
             )
+        cur.close()
+        conn.close()
         return results
     except Exception as e:
+        print(f"DB SEARCH ERROR (tenant_id={tenant_id}): {e}")
+        import traceback
+        traceback.print_exc()
         return []

backend/mcp_servers/main.py CHANGED Viewed

@@ -137,10 +137,19 @@ def ingest(payload: IngestPayload):
 def search(payload: SearchPayload):
     """
     Semantic search using pgvector + MiniLM embeddings.
     """
     try:
         query_embedding = embed_text(payload.query)
-        results = search_vectors(payload.tenant_id, query_embedding, limit=5)
         return {
             "tenant_id": payload.tenant_id,
@@ -148,7 +157,10 @@ def search(payload: SearchPayload):
             "results": results
         }
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))

 def search(payload: SearchPayload):
     """
     Semantic search using pgvector + MiniLM embeddings.
+    Results are filtered by tenant_id in the database query.
     """
     try:
+        # Validate tenant_id is provided
+        if not payload.tenant_id or not payload.tenant_id.strip():
+            raise HTTPException(status_code=400, detail="tenant_id is required")
         query_embedding = embed_text(payload.query)
+        # search_vectors filters by tenant_id in the SQL query
+        results = search_vectors(payload.tenant_id.strip(), query_embedding, limit=10)
+        # Log for debugging (remove in production)
+        print(f"[RAG Search] tenant_id={payload.tenant_id}, query={payload.query[:50]}, results_count={len(results)}")
         return {
             "tenant_id": payload.tenant_id,
             "results": results
         }
+    except HTTPException:
+        raise
     except Exception as e:
+        print(f"[RAG Search Error] tenant_id={payload.tenant_id}, error={str(e)}")
         raise HTTPException(status_code=500, detail=str(e))

backend/mcp_servers/rag_server.py CHANGED Viewed

@@ -39,7 +39,15 @@ def db_insert(tenant_id: str, content: str, vector: list):
 def db_search(tenant_id: str, vector: list, limit: int = 5):
     """Wrapper for search_vectors to match expected interface."""
     results = search_vectors(tenant_id, vector, limit)
-    return [{"text": text} for text in results]
 @rag_app.post("/ingest")
@@ -49,34 +57,17 @@ async def ingest(req: IngestRequest):
     return {"status": "ok"}
-def cosine_similarity(vec_a: List[float], vec_b: List[float]) -> float:
-    import math
-    if not vec_a or not vec_b:
-        return 0.0
-    numerator = sum(a * b for a, b in zip(vec_a, vec_b))
-    denom = math.sqrt(sum(a * a for a in vec_a)) * math.sqrt(sum(b * b for b in vec_b))
-    if denom == 0:
-        return 0.0
-    return numerator / denom
-def rank_chunks(chunks: List[Dict[str, Any]], query_embedding: List[float]):
-    ranked = []
-    for chunk in chunks:
-        chunk_vector = embed_text(chunk.get("text", ""))
-        relevance = cosine_similarity(chunk_vector, query_embedding)
-        chunk["relevance"] = relevance
-        ranked.append(chunk)
-    return sorted(ranked, key=lambda x: x["relevance"], reverse=True)
 @rag_app.post("/search")
 async def search(req: SearchRequest):
     vector = embed_text(req.query)
-    results = db_search(req.tenant_id, vector)
-    ranked = rank_chunks(results, vector)
-    filtered = [chunk for chunk in ranked if chunk["relevance"] >= 0.55][:3]
     return {
         "results": filtered,
         "metadata": {

 def db_search(tenant_id: str, vector: list, limit: int = 5):
     """Wrapper for search_vectors to match expected interface."""
     results = search_vectors(tenant_id, vector, limit)
+    # search_vectors returns list of dicts with "text" and "similarity"
+    # Preserve the structure and use similarity as relevance
+    return [
+        {
+            "text": result.get("text", ""),
+            "relevance": result.get("similarity", 0.0)
+        }
+        for result in results
+    ]
 @rag_app.post("/ingest")
     return {"status": "ok"}
 @rag_app.post("/search")
 async def search(req: SearchRequest):
+    """
+    Search documents for a specific tenant.
+    Results are already filtered by tenant_id in the database query.
+    """
     vector = embed_text(req.query)
+    # db_search already filters by tenant_id and returns results sorted by similarity
+    results = db_search(req.tenant_id, vector, limit=10)  # Get more results for filtering
+    # Filter by relevance threshold and limit to top 3
+    filtered = [chunk for chunk in results if chunk.get("relevance", 0.0) >= 0.55][:3]
     return {
         "results": filtered,
         "metadata": {

backend/tests/test_analytics_store.py ADDED Viewed

	@@ -0,0 +1,208 @@

+"""
+Tests for AnalyticsStore - tenant-level analytics logging
+"""
+import sys
+from pathlib import Path
+# Add backend directory to Python path
+backend_dir = Path(__file__).parent.parent
+sys.path.insert(0, str(backend_dir))
+import pytest
+import time
+import tempfile
+import os
+from api.storage.analytics_store import AnalyticsStore
+@pytest.fixture
+def temp_analytics_db():
+    """Create a temporary database for testing."""
+    with tempfile.NamedTemporaryFile(delete=False, suffix='.db') as f:
+        db_path = f.name
+    yield db_path
+    # Cleanup - close any connections first
+    try:
+        if os.path.exists(db_path):
+            # On Windows, we need to ensure the file is closed
+            import time
+            time.sleep(0.1)  # Brief delay to ensure file is released
+            os.unlink(db_path)
+    except (PermissionError, OSError):
+        # File might still be in use, that's okay for temp files
+        pass
+@pytest.fixture
+def analytics_store(temp_analytics_db):
+    """Create an AnalyticsStore instance with temporary database."""
+    return AnalyticsStore(db_path=temp_analytics_db)
+def test_analytics_store_init(analytics_store):
+    """Test that AnalyticsStore initializes correctly."""
+    assert analytics_store is not None
+    assert analytics_store.db_path.exists()
+def test_log_tool_usage(analytics_store):
+    """Test logging tool usage events."""
+    analytics_store.log_tool_usage(
+        tenant_id="test_tenant",
+        tool_name="rag",
+        latency_ms=150,
+        tokens_used=500,
+        success=True,
+        user_id="user123"
+    )
+    stats = analytics_store.get_tool_usage_stats("test_tenant")
+    assert "rag" in stats
+    assert stats["rag"]["count"] == 1
+    assert stats["rag"]["avg_latency_ms"] == 150.0
+    assert stats["rag"]["total_tokens"] == 500
+def test_log_redflag_violation(analytics_store):
+    """Test logging red-flag violations."""
+    analytics_store.log_redflag_violation(
+        tenant_id="test_tenant",
+        rule_id="rule123",
+        rule_pattern=".*password.*",
+        severity="high",
+        matched_text="password123",
+        confidence=0.95,
+        message_preview="User entered password123",
+        user_id="user123"
+    )
+    violations = analytics_store.get_redflag_violations("test_tenant", limit=10)
+    assert len(violations) == 1
+    assert violations[0]["severity"] == "high"
+    assert violations[0]["confidence"] == 0.95
+    assert violations[0]["matched_text"] == "password123"
+def test_log_rag_search(analytics_store):
+    """Test logging RAG search events with quality metrics."""
+    analytics_store.log_rag_search(
+        tenant_id="test_tenant",
+        query="What is the policy?",
+        hits_count=5,
+        avg_score=0.85,
+        top_score=0.92,
+        latency_ms=120
+    )
+    metrics = analytics_store.get_rag_quality_metrics("test_tenant")
+    assert metrics["total_searches"] == 1
+    assert metrics["avg_hits_per_search"] == 5.0
+    assert metrics["avg_score"] == 0.85
+    assert metrics["avg_top_score"] == 0.92
+def test_log_agent_query(analytics_store):
+    """Test logging agent query events."""
+    analytics_store.log_agent_query(
+        tenant_id="test_tenant",
+        message_preview="What is the company policy?",
+        intent="rag",
+        tools_used=["rag", "llm"],
+        total_tokens=1000,
+        total_latency_ms=250,
+        success=True,
+        user_id="user123"
+    )
+    activity = analytics_store.get_activity_summary("test_tenant")
+    assert activity["total_queries"] == 1
+    assert activity["active_users"] == 1
+def test_tool_usage_stats_filtered_by_time(analytics_store):
+    """Test that tool usage stats can be filtered by timestamp."""
+    # Log an old event (1 day ago)
+    old_timestamp = int(time.time()) - 86400
+    # Note: We can't directly set timestamp in current implementation,
+    # but we can test the filtering works
+    analytics_store.log_tool_usage(
+        tenant_id="test_tenant",
+        tool_name="web",
+        latency_ms=100
+    )
+    # Get stats without time filter
+    all_stats = analytics_store.get_tool_usage_stats("test_tenant")
+    assert "web" in all_stats
+    # Get stats with recent time filter
+    recent_timestamp = int(time.time()) - 3600  # Last hour
+    recent_stats = analytics_store.get_tool_usage_stats("test_tenant", recent_timestamp)
+    assert "web" in recent_stats
+def test_get_activity_summary(analytics_store):
+    """Test getting activity summary for a tenant."""
+    # Log multiple queries
+    for i in range(3):
+        analytics_store.log_agent_query(
+            tenant_id="test_tenant",
+            message_preview=f"Query {i}",
+            intent="general",
+            tools_used=["llm"],
+            user_id=f"user{i}"
+        )
+    activity = analytics_store.get_activity_summary("test_tenant")
+    assert activity["total_queries"] == 3
+    assert activity["active_users"] == 3
+def test_get_rag_quality_metrics(analytics_store):
+    """Test getting RAG quality metrics."""
+    # Log multiple RAG searches
+    for i in range(3):
+        analytics_store.log_rag_search(
+            tenant_id="test_tenant",
+            query=f"Query {i}",
+            hits_count=5 + i,
+            avg_score=0.8 + i * 0.05,
+            top_score=0.9 + i * 0.05,
+            latency_ms=100 + i * 10
+        )
+    metrics = analytics_store.get_rag_quality_metrics("test_tenant")
+    assert metrics["total_searches"] == 3
+    assert metrics["avg_hits_per_search"] > 0
+    assert metrics["avg_score"] > 0
+def test_multiple_tenants_isolation(analytics_store):
+    """Test that analytics are properly isolated by tenant."""
+    # Log events for tenant1
+    analytics_store.log_tool_usage(
+        tenant_id="tenant1",
+        tool_name="rag",
+        latency_ms=100
+    )
+    # Log events for tenant2
+    analytics_store.log_tool_usage(
+        tenant_id="tenant2",
+        tool_name="web",
+        latency_ms=200
+    )
+    # Check tenant1 stats
+    tenant1_stats = analytics_store.get_tool_usage_stats("tenant1")
+    assert "rag" in tenant1_stats
+    assert "web" not in tenant1_stats
+    # Check tenant2 stats
+    tenant2_stats = analytics_store.get_tool_usage_stats("tenant2")
+    assert "web" in tenant2_stats
+    assert "rag" not in tenant2_stats

backend/tests/test_api_endpoints.py ADDED Viewed

	@@ -0,0 +1,202 @@

+"""
+Integration tests for new API endpoints
+"""
+import sys
+from pathlib import Path
+# Add backend to path
+backend_dir = Path(__file__).parent.parent
+sys.path.insert(0, str(backend_dir))
+# Add root directory to path for backend.api imports
+root_dir = Path(__file__).resolve().parents[2]
+sys.path.insert(0, str(root_dir))
+import pytest
+from fastapi.testclient import TestClient
+from fastapi import FastAPI
+try:
+    from backend.api.main import app
+except ImportError:
+    # Fallback if backend.api.main doesn't work
+    from api.main import app
+@pytest.fixture
+def client():
+    """Create a test client."""
+    return TestClient(app)
+def test_analytics_overview_endpoint(client):
+    """Test /analytics/overview endpoint."""
+    response = client.get(
+        "/analytics/overview",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"days": 30}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenant_id" in data
+    assert "overview" in data
+    assert "total_queries" in data["overview"]
+    assert "tool_usage" in data["overview"]
+    assert "redflag_count" in data["overview"]
+def test_analytics_tool_usage_endpoint(client):
+    """Test /analytics/tool-usage endpoint."""
+    response = client.get(
+        "/analytics/tool-usage",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"days": 30}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenant_id" in data
+    assert "tool_usage" in data
+    assert "period_days" in data
+def test_analytics_rag_quality_endpoint(client):
+    """Test /analytics/rag-quality endpoint."""
+    response = client.get(
+        "/analytics/rag-quality",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"days": 30}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenant_id" in data
+    assert "rag_quality" in data
+def test_admin_rules_with_regex(client):
+    """Test adding admin rule with regex pattern and severity."""
+    response = client.post(
+        "/admin/rules",
+        headers={"x-tenant-id": "test_tenant"},
+        json={
+            "rule": "Block password queries",
+            "pattern": ".*password.*",
+            "severity": "high",
+            "description": "Blocks password-related queries"
+        }
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert data["severity"] == "high"
+    assert ".*password.*" in data["pattern"]
+    # Get detailed rules
+    response = client.get(
+        "/admin/rules",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"detailed": True}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "rules" in data
+    assert len(data["rules"]) > 0
+    assert data["rules"][0]["severity"] == "high"
+def test_admin_violations_endpoint(client):
+    """Test /admin/violations endpoint."""
+    response = client.get(
+        "/admin/violations",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"limit": 50, "days": 30}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenant_id" in data
+    assert "violations" in data
+    assert "count" in data
+def test_admin_tools_logs_endpoint(client):
+    """Test /admin/tools/logs endpoint."""
+    response = client.get(
+        "/admin/tools/logs",
+        headers={"x-tenant-id": "test_tenant"},
+        params={"tool_name": "rag", "days": 7}
+    )
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenant_id" in data
+    assert "tool_usage" in data
+def test_agent_debug_endpoint(client):
+    """Test /agent/debug endpoint."""
+    # Note: This will fail if LLM/MCP servers are not running
+    # But we can at least test the endpoint structure
+    response = client.post(
+        "/agent/debug",
+        json={
+            "tenant_id": "test_tenant",
+            "message": "Test message",
+            "temperature": 0.0
+        }
+    )
+    # Might fail if services not available, but should have proper error handling
+    assert response.status_code in [200, 500, 503]  # Accept various status codes
+def test_agent_plan_endpoint(client):
+    """Test /agent/plan endpoint."""
+    # Note: This will fail if LLM/MCP servers are not running
+    response = client.post(
+        "/agent/plan",
+        json={
+            "tenant_id": "test_tenant",
+            "message": "What is the company policy?",
+            "temperature": 0.0
+        }
+    )
+    # Might fail if services not available
+    assert response.status_code in [200, 500, 503]
+def test_missing_tenant_id_returns_400(client):
+    """Test that endpoints return 400 when tenant ID is missing."""
+    endpoints = [
+        "/analytics/overview",
+        "/analytics/tool-usage",
+        "/admin/rules",
+        "/admin/violations"
+    ]
+    for endpoint in endpoints:
+        response = client.get(endpoint)
+        assert response.status_code == 400, f"Endpoint {endpoint} should return 400"
+def test_admin_tenants_endpoints(client):
+    """Test tenant management endpoints (placeholders)."""
+    # List tenants
+    response = client.get("/admin/tenants")
+    assert response.status_code == 200
+    data = response.json()
+    assert "tenants" in data
+    # Create tenant (placeholder)
+    response = client.post("/admin/tenants", params={"tenant_id": "new_tenant"})
+    assert response.status_code == 200
+    # Delete tenant (placeholder)
+    response = client.delete("/admin/tenants/new_tenant")
+    assert response.status_code == 200

backend/tests/test_enhanced_admin_rules.py ADDED Viewed

	@@ -0,0 +1,195 @@

+"""
+Tests for enhanced admin rules with regex and severity support
+"""
+import sys
+from pathlib import Path
+# Add backend directory to Python path
+backend_dir = Path(__file__).parent.parent
+sys.path.insert(0, str(backend_dir))
+import pytest
+import tempfile
+import os
+import re
+from api.storage.rules_store import RulesStore
+@pytest.fixture
+def temp_rules_db():
+    """Create a temporary database for testing."""
+    with tempfile.NamedTemporaryFile(delete=False, suffix='.db') as f:
+        db_path = f.name
+    yield db_path
+    # Cleanup
+    if os.path.exists(db_path):
+        os.unlink(db_path)
+@pytest.fixture
+def rules_store(temp_rules_db):
+    """Create a RulesStore instance with temporary database."""
+    # RulesStore uses a fixed path, so we'll just use the default
+    # For tests, it will create/use data/admin_rules.db
+    # Each test should use unique tenant_id to avoid conflicts
+    store = RulesStore()
+    yield store
+    # Cleanup: Delete test data after each test
+    # Note: In a real scenario, you'd want to clean up specific tenant data
+    # For now, tests use unique tenant IDs to avoid conflicts
+def test_add_rule_with_regex_and_severity(rules_store):
+    """Test adding a rule with regex pattern and severity."""
+    tenant_id = "test_tenant_regex_severity"  # Unique tenant ID
+    success = rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Block password queries",
+        pattern=r".*password.*|.*pwd.*",
+        severity="high",
+        description="Blocks any queries containing password or pwd",
+        enabled=True
+    )
+    assert success is True
+    # Get detailed rules
+    rules = rules_store.get_rules_detailed(tenant_id)
+    assert len(rules) == 1
+    assert rules[0]["pattern"] == r".*password.*|.*pwd.*"
+    assert rules[0]["severity"] == "high"
+    assert rules[0]["description"] == "Blocks any queries containing password or pwd"
+    assert rules[0]["enabled"] == 1
+def test_add_rule_without_pattern_uses_rule_text(rules_store):
+    """Test that if pattern is not provided, rule text is used as pattern."""
+    tenant_id = "test_tenant_no_pattern"  # Unique tenant ID
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Block sensitive data",
+        severity="medium"
+    )
+    rules = rules_store.get_rules_detailed(tenant_id)
+    assert len(rules) == 1
+    assert rules[0]["pattern"] == "Block sensitive data"
+    assert rules[0]["severity"] == "medium"
+def test_get_rules_backward_compatibility(rules_store):
+    """Test that get_rules() still returns simple list for backward compatibility."""
+    tenant_id = "test_tenant_backward_compat"  # Unique tenant ID
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Rule 1",
+        severity="low"
+    )
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Rule 2",
+        severity="high"
+    )
+    rules = rules_store.get_rules(tenant_id)
+    assert isinstance(rules, list)
+    assert len(rules) == 2
+    assert "Rule 1" in rules
+    assert "Rule 2" in rules
+def test_regex_pattern_matching(rules_store):
+    """Test that regex patterns work correctly."""
+    tenant_id = "test_tenant_regex_match"  # Unique tenant ID
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Email pattern",
+        pattern=r".*@.*\..*",
+        severity="medium"
+    )
+    rules = rules_store.get_rules_detailed(tenant_id)
+    assert len(rules) == 1
+    pattern = rules[0]["pattern"]
+    # Test regex matching
+    test_cases = [
+        ("user@example.com", True),
+        ("contact me at test@domain.org", True),
+        ("no email here", False),
+        ("just text", False)
+    ]
+    regex = re.compile(pattern, re.IGNORECASE)
+    for text, should_match in test_cases:
+        assert (regex.search(text) is not None) == should_match, f"Failed for: {text}"
+def test_severity_levels(rules_store):
+    """Test different severity levels."""
+    tenant_id = "test_tenant_severity"  # Unique tenant ID
+    severities = ["low", "medium", "high", "critical"]
+    for i, severity in enumerate(severities):
+        rules_store.add_rule(
+            tenant_id=tenant_id,
+            rule=f"Rule {severity}",
+            severity=severity
+        )
+    rules = rules_store.get_rules_detailed(tenant_id)
+    assert len(rules) == len(severities)
+    for rule in rules:
+        assert rule["severity"] in severities
+def test_disabled_rules_not_returned(rules_store):
+    """Test that disabled rules are not returned by get_rules()."""
+    tenant_id = "test_tenant_disabled"  # Unique tenant ID
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Enabled rule",
+        enabled=True
+    )
+    rules_store.add_rule(
+        tenant_id=tenant_id,
+        rule="Disabled rule",
+        enabled=False
+    )
+    rules = rules_store.get_rules(tenant_id)
+    assert len(rules) == 1
+    assert "Enabled rule" in rules
+    assert "Disabled rule" not in rules
+    # But disabled rules should still exist in detailed view (if we add a method for that)
+    # For now, we rely on enabled column filtering
+def test_multiple_tenants_isolation(rules_store):
+    """Test that rules are properly isolated by tenant."""
+    rules_store.add_rule(
+        tenant_id="tenant1",
+        rule="Tenant 1 rule",
+        severity="low"
+    )
+    rules_store.add_rule(
+        tenant_id="tenant2",
+        rule="Tenant 2 rule",
+        severity="high"
+    )
+    tenant1_rules = rules_store.get_rules("tenant1")
+    tenant2_rules = rules_store.get_rules("tenant2")
+    assert len(tenant1_rules) == 1
+    assert "Tenant 1 rule" in tenant1_rules
+    assert "Tenant 2 rule" not in tenant1_rules
+    assert len(tenant2_rules) == 1
+    assert "Tenant 2 rule" in tenant2_rules
+    assert "Tenant 1 rule" not in tenant2_rules

check_rag_database.py ADDED Viewed

	@@ -0,0 +1,125 @@

+"""
+Diagnostic script to check RAG database tenant isolation
+This script directly queries the database to verify tenant_id isolation.
+"""
+import sys
+from pathlib import Path
+# Add backend to path
+backend_dir = Path(__file__).parent / "backend"
+sys.path.insert(0, str(backend_dir))
+def check_database():
+    """Check database directly for tenant isolation"""
+    print("\n" + "="*60)
+    print("RAG Database Tenant Isolation Check")
+    print("="*60)
+    try:
+        from mcp_servers.database import get_connection
+        import psycopg2.extras
+        conn = get_connection()
+        cur = conn.cursor(cursor_factory=psycopg2.extras.DictCursor)
+        # Check all tenant_ids in database
+        print("\n1. Checking all tenant_ids in database...")
+        cur.execute("SELECT DISTINCT tenant_id, COUNT(*) as count FROM documents GROUP BY tenant_id")
+        rows = cur.fetchall()
+        if not rows:
+            print("   ⚠️ No documents found in database")
+            cur.close()
+            conn.close()
+            return
+        print(f"   Found {len(rows)} unique tenant(s):")
+        for row in rows:
+            print(f"   - tenant_id: '{row['tenant_id']}' ({row['count']} documents)")
+        # Check for tenant1 documents
+        print("\n2. Checking documents for 'verify_tenant1'...")
+        cur.execute(
+            "SELECT id, tenant_id, LEFT(chunk_text, 50) as preview FROM documents WHERE tenant_id = %s LIMIT 5",
+            ("verify_tenant1",)
+        )
+        tenant1_docs = cur.fetchall()
+        print(f"   Found {len(tenant1_docs)} documents for verify_tenant1")
+        for doc in tenant1_docs:
+            preview = doc['preview'].replace('\n', ' ')
+            print(f"   - ID: {doc['id']}, tenant_id: '{doc['tenant_id']}', preview: {preview[:50]}...")
+        # Check for tenant2 documents
+        print("\n3. Checking documents for 'verify_tenant2'...")
+        cur.execute(
+            "SELECT id, tenant_id, LEFT(chunk_text, 50) as preview FROM documents WHERE tenant_id = %s LIMIT 5",
+            ("verify_tenant2",)
+        )
+        tenant2_docs = cur.fetchall()
+        print(f"   Found {len(tenant2_docs)} documents for verify_tenant2")
+        for doc in tenant2_docs:
+            preview = doc['preview'].replace('\n', ' ')
+            print(f"   - ID: {doc['id']}, tenant_id: '{doc['tenant_id']}', preview: {preview[:50]}...")
+        # Test search_vectors function directly
+        print("\n4. Testing search_vectors function directly...")
+        from mcp_servers.embeddings import embed_text
+        from mcp_servers.database import search_vectors
+        # Search for tenant1's secret as tenant1
+        query = "TENANT1_SECRET"
+        query_vector = embed_text(query)
+        results_tenant1 = search_vectors("verify_tenant1", query_vector, limit=5)
+        print(f"   Searching for '{query}' as verify_tenant1: {len(results_tenant1)} results")
+        for i, result in enumerate(results_tenant1[:2], 1):
+            text_preview = result['text'][:80].replace('\n', ' ')
+            print(f"   Result {i}: {text_preview}...")
+        # Search for tenant1's secret as tenant2 (should NOT find)
+        results_tenant2 = search_vectors("verify_tenant2", query_vector, limit=5)
+        print(f"   Searching for '{query}' as verify_tenant2: {len(results_tenant2)} results")
+        if results_tenant2:
+            print("   ⚠️ WARNING: tenant2 found tenant1's secret!")
+            for i, result in enumerate(results_tenant2[:2], 1):
+                text_preview = result['text'][:80].replace('\n', ' ')
+                print(f"   Result {i}: {text_preview}...")
+        else:
+            print("   ✅ PASSED: tenant2 cannot see tenant1's secret")
+        # Check for any documents with wrong tenant_id
+        print("\n5. Checking for data integrity issues...")
+        cur.execute("""
+            SELECT tenant_id, COUNT(*) as count
+            FROM documents
+            WHERE tenant_id IN ('verify_tenant1', 'verify_tenant2')
+            GROUP BY tenant_id
+        """)
+        integrity_check = cur.fetchall()
+        print("   Tenant document counts:")
+        for row in integrity_check:
+            print(f"   - {row['tenant_id']}: {row['count']} documents")
+        cur.close()
+        conn.close()
+        print("\n" + "="*60)
+        if results_tenant2 and "TENANT1_SECRET" in str(results_tenant2):
+            print("❌ ISOLATION FAILED: tenant2 can see tenant1's documents")
+        else:
+            print("✅ Database isolation appears to be working correctly")
+        print("="*60)
+    except ImportError as e:
+        print(f"\n❌ Import error: {e}")
+        print("   Make sure you're running from the project root directory")
+    except Exception as e:
+        print(f"\n❌ Error: {e}")
+        import traceback
+        traceback.print_exc()
+if __name__ == "__main__":
+    check_database()

data/admin_rules.db CHANGED Viewed

Binary files a/data/admin_rules.db and b/data/admin_rules.db differ

data/analytics.db ADDED Viewed

Binary file (41 kB). View file

test_manual.py ADDED Viewed

	@@ -0,0 +1,306 @@

+"""
+Manual testing script for IntegraChat improvements
+Run this script to test all new features:
+- Analytics logging
+- Enhanced admin rules with regex/severity
+- API endpoints
+- Agent debug/plan endpoints
+Usage:
+    python test_manual.py
+"""
+import requests
+import json
+import time
+from pathlib import Path
+import sys
+# Add backend to path
+backend_dir = Path(__file__).parent / "backend"
+sys.path.insert(0, str(backend_dir))
+# Also add root for backend.api imports
+root_dir = Path(__file__).parent
+sys.path.insert(0, str(root_dir))
+BASE_URL = "http://localhost:8000"
+TENANT_ID = "test_tenant_manual"
+def print_section(title):
+    print("\n" + "=" * 60)
+    print(f"  {title}")
+    print("=" * 60)
+def test_analytics_store():
+    """Test AnalyticsStore directly."""
+    print_section("Testing AnalyticsStore")
+    try:
+        from api.storage.analytics_store import AnalyticsStore
+        store = AnalyticsStore()
+        # Log various events
+        print("Logging tool usage...")
+        store.log_tool_usage(TENANT_ID, "rag", latency_ms=150, tokens_used=500, success=True)
+        store.log_tool_usage(TENANT_ID, "web", latency_ms=80, success=True)
+        store.log_tool_usage(TENANT_ID, "llm", latency_ms=200, tokens_used=1000, success=True)
+        print("Logging red-flag violation...")
+        store.log_redflag_violation(
+            TENANT_ID,
+            "rule1",
+            ".*password.*",
+            "high",
+            "password123",
+            confidence=0.95,
+            message_preview="User asked about password"
+        )
+        print("Logging RAG search...")
+        store.log_rag_search(
+            TENANT_ID,
+            "What is the company policy?",
+            hits_count=5,
+            avg_score=0.85,
+            top_score=0.92,
+            latency_ms=120
+        )
+        print("Logging agent query...")
+        store.log_agent_query(
+            TENANT_ID,
+            "What is the company policy?",
+            intent="rag",
+            tools_used=["rag", "llm"],
+            total_tokens=1000,
+            total_latency_ms=250,
+            success=True
+        )
+        # Get stats
+        print("\n📊 Tool Usage Stats:")
+        print(json.dumps(store.get_tool_usage_stats(TENANT_ID), indent=2))
+        print("\n🚨 Red-Flag Violations:")
+        violations = store.get_redflag_violations(TENANT_ID)
+        print(json.dumps(violations, indent=2, default=str))
+        print("\n📈 Activity Summary:")
+        print(json.dumps(store.get_activity_summary(TENANT_ID), indent=2, default=str))
+        print("\n🔍 RAG Quality Metrics:")
+        print(json.dumps(store.get_rag_quality_metrics(TENANT_ID), indent=2))
+        print("\n✅ AnalyticsStore tests passed!")
+        return True
+    except Exception as e:
+        print(f"❌ AnalyticsStore test failed: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def test_admin_rules():
+    """Test enhanced admin rules with regex and severity."""
+    print_section("Testing Enhanced Admin Rules")
+    try:
+        from api.storage.rules_store import RulesStore
+        import re
+        store = RulesStore()
+        # Add rules with regex and severity
+        print("Adding rules with regex patterns...")
+        store.add_rule(
+            TENANT_ID,
+            "Block password queries",
+            pattern=".*password.*|.*pwd.*",
+            severity="high",
+            description="Blocks password-related queries"
+        )
+        store.add_rule(
+            TENANT_ID,
+            "Block email sharing",
+            pattern=".*@.*\\..*",
+            severity="medium",
+            description="Blocks email addresses"
+        )
+        store.add_rule(
+            TENANT_ID,
+            "Simple keyword rule",
+            severity="low"
+        )
+        # Get detailed rules
+        rules = store.get_rules_detailed(TENANT_ID)
+        print("\n📋 Rules with Metadata:")
+        print(json.dumps(rules, indent=2, default=str))
+        # Test regex matching
+        print("\n🧪 Testing Regex Patterns:")
+        for rule in rules:
+            if rule.get("pattern"):
+                pattern = rule["pattern"]
+                regex = re.compile(pattern, re.IGNORECASE)
+                test_cases = [
+                    "What is my password?",
+                    "My email is test@example.com",
+                    "Just regular text"
+                ]
+                for test_text in test_cases:
+                    match = regex.search(test_text)
+                    print(f"  Pattern: {pattern[:30]}... | Text: \"{test_text}\" | Match: {match is not None}")
+        print("\n✅ Admin Rules tests passed!")
+        return True
+    except Exception as e:
+        print(f"❌ Admin Rules test failed: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def test_api_endpoints():
+    """Test API endpoints."""
+    print_section("Testing API Endpoints")
+    headers = {"x-tenant-id": TENANT_ID}
+    endpoints = [
+        ("GET", "/analytics/overview?days=30", None),
+        ("GET", "/analytics/tool-usage?days=30", None),
+        ("GET", "/analytics/rag-quality?days=30", None),
+        ("GET", "/analytics/redflags?limit=50&days=30", None),
+        ("GET", "/admin/rules?detailed=true", None),
+        ("GET", "/admin/violations?limit=50&days=30", None),
+        ("GET", "/admin/tools/logs?days=7", None),
+    ]
+    results = []
+    for method, endpoint, data in endpoints:
+        try:
+            url = f"{BASE_URL}{endpoint}"
+            if method == "GET":
+                response = requests.get(url, headers=headers, timeout=5)
+            else:
+                response = requests.post(url, headers=headers, json=data, timeout=5)
+            status = "✅" if response.status_code == 200 else "⚠️"
+            print(f"{status} {method} {endpoint} - Status: {response.status_code}")
+            if response.status_code == 200:
+                result = response.json()
+                print(f"   Response keys: {list(result.keys())[:5]}")
+            results.append(response.status_code == 200)
+        except requests.exceptions.ConnectionError:
+            print(f"❌ {method} {endpoint} - Cannot connect to {BASE_URL}")
+            print("   Make sure the FastAPI server is running on port 8000")
+            results.append(False)
+        except Exception as e:
+            print(f"❌ {method} {endpoint} - Error: {e}")
+            results.append(False)
+    # Test POST endpoints
+    print("\n📝 Testing POST Endpoints...")
+    try:
+        # Add admin rule
+        response = requests.post(
+            f"{BASE_URL}/admin/rules",
+            headers=headers,
+            json={
+                "rule": "Test rule via API",
+                "pattern": ".*test.*",
+                "severity": "medium"
+            },
+            timeout=5
+        )
+        status = "✅" if response.status_code == 200 else "⚠️"
+        print(f"{status} POST /admin/rules - Status: {response.status_code}")
+        results.append(response.status_code == 200)
+    except Exception as e:
+        print(f"❌ POST /admin/rules - Error: {e}")
+        results.append(False)
+    # Test agent endpoints (may fail if services not running)
+    print("\n🤖 Testing Agent Endpoints...")
+    agent_endpoints = [
+        ("/agent/plan", {"tenant_id": TENANT_ID, "message": "Test message", "temperature": 0.0}),
+    ]
+    for endpoint, data in agent_endpoints:
+        try:
+            response = requests.post(
+                f"{BASE_URL}{endpoint}",
+                json=data,
+                timeout=10
+            )
+            status = "✅" if response.status_code == 200 else "⚠️"
+            print(f"{status} POST {endpoint} - Status: {response.status_code}")
+            if response.status_code == 200:
+                result = response.json()
+                print(f"   Response keys: {list(result.keys())[:5]}")
+            results.append(response.status_code in [200, 500, 503])  # Accept various status codes
+        except Exception as e:
+            print(f"⚠️ POST {endpoint} - Error: {e} (May be expected if services not running)")
+            results.append(True)  # Don't fail if services not running
+    success_count = sum(results)
+    total_count = len(results)
+    print(f"\n📊 API Endpoint Tests: {success_count}/{total_count} passed")
+    return success_count == total_count or success_count >= total_count * 0.8  # 80% pass rate
+def main():
+    """Run all manual tests."""
+    print("\n" + "🚀" * 30)
+    print("IntegraChat Manual Testing Suite")
+    print("🚀" * 30)
+    results = []
+    # Test Analytics Store
+    results.append(test_analytics_store())
+    time.sleep(1)
+    # Test Admin Rules
+    results.append(test_admin_rules())
+    time.sleep(1)
+    # Test API Endpoints
+    results.append(test_api_endpoints())
+    # Summary
+    print_section("Test Summary")
+    passed = sum(results)
+    total = len(results)
+    print(f"Tests Passed: {passed}/{total}")
+    if passed == total:
+        print("✅ All tests passed!")
+    elif passed >= total * 0.8:
+        print("⚠️ Most tests passed (some may require running services)")
+    else:
+        print("❌ Some tests failed. Check errors above.")
+    print("\n💡 Tips:")
+    print("  - For API tests, ensure FastAPI server is running: uvicorn backend.api.main:app --port 8000")
+    print("  - Agent endpoints may require MCP servers and LLM to be running")
+    print("  - Check TESTING_GUIDE.md for more detailed testing instructions")
+if __name__ == "__main__":
+    main()

test_simple.py ADDED Viewed

	@@ -0,0 +1,148 @@

+"""
+Simple standalone test script - can be run directly without pytest
+Usage:
+    python test_simple.py
+"""
+import sys
+from pathlib import Path
+# Setup paths
+backend_dir = Path(__file__).parent / "backend"
+sys.path.insert(0, str(backend_dir))
+root_dir = Path(__file__).parent
+sys.path.insert(0, str(root_dir))
+def test_analytics_store():
+    """Test AnalyticsStore"""
+    print("\n" + "="*60)
+    print("Testing AnalyticsStore")
+    print("="*60)
+    try:
+        from api.storage.analytics_store import AnalyticsStore
+        store = AnalyticsStore()
+        tenant_id = "test_simple"
+        # Log some events
+        print("✓ Logging tool usage...")
+        store.log_tool_usage(tenant_id, "rag", latency_ms=150, tokens_used=500, success=True)
+        store.log_tool_usage(tenant_id, "web", latency_ms=80, success=True)
+        print("✓ Logging red-flag violation...")
+        store.log_redflag_violation(
+            tenant_id, "rule1", ".*password.*", "high",
+            "password123", confidence=0.95
+        )
+        print("✓ Logging RAG search...")
+        store.log_rag_search(tenant_id, "test query", hits_count=5, avg_score=0.85)
+        # Get stats
+        print("\n📊 Tool Usage Stats:")
+        stats = store.get_tool_usage_stats(tenant_id)
+        print(f"  RAG: {stats.get('rag', {})}")
+        print(f"  Web: {stats.get('web', {})}")
+        print("\n🚨 Violations:")
+        violations = store.get_redflag_violations(tenant_id)
+        print(f"  Count: {len(violations)}")
+        if violations:
+            print(f"  First: {violations[0]['severity']} - {violations[0]['matched_text']}")
+        print("\n✅ AnalyticsStore test PASSED!")
+        return True
+    except Exception as e:
+        print(f"\n❌ AnalyticsStore test FAILED: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def test_admin_rules():
+    """Test Admin Rules with regex"""
+    print("\n" + "="*60)
+    print("Testing Admin Rules (Regex & Severity)")
+    print("="*60)
+    try:
+        from api.storage.rules_store import RulesStore
+        import re
+        store = RulesStore()
+        tenant_id = "test_simple"
+        # Add rule with regex
+        print("✓ Adding rule with regex pattern...")
+        store.add_rule(
+            tenant_id,
+            "Block password queries",
+            pattern=".*password.*",
+            severity="high",
+            description="Blocks password queries"
+        )
+        # Get detailed rules
+        rules = store.get_rules_detailed(tenant_id)
+        print(f"\n📋 Rules found: {len(rules)}")
+        if rules:
+            rule = rules[0]
+            print(f"  Pattern: {rule['pattern']}")
+            print(f"  Severity: {rule['severity']}")
+            print(f"  Description: {rule['description']}")
+            # Test regex
+            print("\n🧪 Testing regex pattern...")
+            regex = re.compile(rule['pattern'], re.IGNORECASE)
+            test_cases = [
+                ("What is my password?", True),
+                ("Regular text", False)
+            ]
+            for text, should_match in test_cases:
+                match = regex.search(text) is not None
+                status = "✓" if match == should_match else "✗"
+                print(f"  {status} '{text}' -> {match} (expected {should_match})")
+        print("\n✅ Admin Rules test PASSED!")
+        return True
+    except Exception as e:
+        print(f"\n❌ Admin Rules test FAILED: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def main():
+    """Run all tests"""
+    print("\n🚀 IntegraChat Simple Tests")
+    print("="*60)
+    results = []
+    results.append(test_analytics_store())
+    results.append(test_admin_rules())
+    # Summary
+    print("\n" + "="*60)
+    print("Test Summary")
+    print("="*60)
+    passed = sum(results)
+    total = len(results)
+    print(f"Tests Passed: {passed}/{total}")
+    if passed == total:
+        print("✅ All tests passed!")
+        return 0
+    else:
+        print("❌ Some tests failed")
+        return 1
+if __name__ == "__main__":
+    exit(main())

verify_tenant_isolation.py ADDED Viewed

	@@ -0,0 +1,449 @@

+"""
+verify_tenant_isolation.py
+Script to verify tenant_id is properly used for data isolation
+Usage:
+    python verify_tenant_isolation.py
+This script tests:
+- Admin rules isolation
+- Analytics isolation
+- RAG document isolation
+- Database direct verification
+"""
+import requests
+import json
+from pathlib import Path
+import sys
+# Add backend to path
+backend_dir = Path(__file__).parent / "backend"
+sys.path.insert(0, str(backend_dir))
+root_dir = Path(__file__).parent
+sys.path.insert(0, str(root_dir))
+BASE_URL = "http://localhost:8000"
+def print_section(title):
+    """Print a formatted section header"""
+    print("\n" + "="*60)
+    print(f"  {title}")
+    print("="*60)
+def verify_admin_rules_isolation():
+    """Verify admin rules are isolated by tenant_id"""
+    print_section("Testing Admin Rules Isolation")
+    tenant1 = "verify_tenant1"
+    tenant2 = "verify_tenant2"
+    try:
+        # Add rules for different tenants
+        print(f"\n1. Adding rule for {tenant1}...")
+        response = requests.post(
+            f"{BASE_URL}/admin/rules",
+            headers={"x-tenant-id": tenant1, "Content-Type": "application/json"},
+            json={"rule": f"Rule for {tenant1}", "severity": "high"},
+            timeout=5
+        )
+        print(f"   Status: {response.status_code}")
+        print(f"\n2. Adding rule for {tenant2}...")
+        response = requests.post(
+            f"{BASE_URL}/admin/rules",
+            headers={"x-tenant-id": tenant2, "Content-Type": "application/json"},
+            json={"rule": f"Rule for {tenant2}", "severity": "low"},
+            timeout=5
+        )
+        print(f"   Status: {response.status_code}")
+        # Get rules for tenant1
+        print(f"\n3. Getting rules for {tenant1}...")
+        response = requests.get(
+            f"{BASE_URL}/admin/rules",
+            headers={"x-tenant-id": tenant1},
+            timeout=5
+        )
+        tenant1_rules = response.json().get("rules", [])
+        print(f"   Found {len(tenant1_rules)} rules")
+        print(f"   Rules: {tenant1_rules}")
+        # Get rules for tenant2
+        print(f"\n4. Getting rules for {tenant2}...")
+        response = requests.get(
+            f"{BASE_URL}/admin/rules",
+            headers={"x-tenant-id": tenant2},
+            timeout=5
+        )
+        tenant2_rules = response.json().get("rules", [])
+        print(f"   Found {len(tenant2_rules)} rules")
+        print(f"   Rules: {tenant2_rules}")
+        # Verify isolation
+        print("\n5. Verifying isolation...")
+        tenant1_rule_text = f"Rule for {tenant1}"
+        tenant2_rule_text = f"Rule for {tenant2}"
+        tenant1_has_own_rule = tenant1_rule_text in tenant1_rules
+        tenant1_has_other_rule = tenant2_rule_text in tenant1_rules
+        tenant2_has_own_rule = tenant2_rule_text in tenant2_rules
+        tenant2_has_other_rule = tenant1_rule_text in tenant2_rules
+        print(f"   Tenant1 has own rule: {tenant1_has_own_rule} ✓")
+        print(f"   Tenant1 has other's rule: {tenant1_has_other_rule} {'✗ FAILED!' if tenant1_has_other_rule else '✓ PASSED'}")
+        print(f"   Tenant2 has own rule: {tenant2_has_own_rule} ✓")
+        print(f"   Tenant2 has other's rule: {tenant2_has_other_rule} {'✗ FAILED!' if tenant2_has_other_rule else '✓ PASSED'}")
+        if not tenant1_has_other_rule and not tenant2_has_other_rule:
+            print("\n✅ Admin Rules Isolation: PASSED")
+            return True
+        else:
+            print("\n❌ Admin Rules Isolation: FAILED")
+            return False
+    except requests.exceptions.ConnectionError:
+        print("\n⚠️ Cannot connect to API. Make sure it's running:")
+        print("   uvicorn backend.api.main:app --port 8000")
+        return None
+    except Exception as e:
+        print(f"\n❌ Error: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def verify_analytics_isolation():
+    """Verify analytics are isolated by tenant_id"""
+    print_section("Testing Analytics Isolation")
+    tenant1 = "verify_tenant1"
+    tenant2 = "verify_tenant2"
+    try:
+        # Make queries for different tenants
+        print(f"\n1. Making query as {tenant1}...")
+        response = requests.post(
+            f"{BASE_URL}/agent/message",
+            json={"tenant_id": tenant1, "message": "Test query from tenant1"},
+            timeout=10
+        )
+        print(f"   Status: {response.status_code}")
+        print(f"\n2. Making query as {tenant2}...")
+        response = requests.post(
+            f"{BASE_URL}/agent/message",
+            json={"tenant_id": tenant2, "message": "Test query from tenant2"},
+            timeout=10
+        )
+        print(f"   Status: {response.status_code}")
+        # Get analytics for tenant1
+        print(f"\n3. Getting analytics for {tenant1}...")
+        response = requests.get(
+            f"{BASE_URL}/analytics/overview?days=30",
+            headers={"x-tenant-id": tenant1},
+            timeout=5
+        )
+        tenant1_analytics = response.json()
+        print(f"   Total queries: {tenant1_analytics.get('total_queries', 0)}")
+        # Get analytics for tenant2
+        print(f"\n4. Getting analytics for {tenant2}...")
+        response = requests.get(
+            f"{BASE_URL}/analytics/overview?days=30",
+            headers={"x-tenant-id": tenant2},
+            timeout=5
+        )
+        tenant2_analytics = response.json()
+        print(f"   Total queries: {tenant2_analytics.get('total_queries', 0)}")
+        # Verify they're different
+        print("\n5. Verifying isolation...")
+        tenant1_queries = tenant1_analytics.get('total_queries', 0)
+        tenant2_queries = tenant2_analytics.get('total_queries', 0)
+        print(f"   Tenant1 queries: {tenant1_queries}")
+        print(f"   Tenant2 queries: {tenant2_queries}")
+        if tenant1_queries > 0 and tenant2_queries > 0:
+            print("\n✅ Analytics Isolation: PASSED (both tenants have their own data)")
+            return True
+        else:
+            print("\n⚠️ Analytics Isolation: Need more queries to verify")
+            return True
+    except requests.exceptions.ConnectionError:
+        print("\n⚠️ Cannot connect to API. Make sure it's running:")
+        print("   uvicorn backend.api.main:app --port 8000")
+        return None
+    except Exception as e:
+        print(f"\n❌ Error: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def verify_rag_isolation():
+    """Verify RAG documents are isolated by tenant_id"""
+    print_section("Testing RAG Document Isolation")
+    tenant1 = "verify_tenant1"
+    tenant2 = "verify_tenant2"
+    try:
+        # Ingest documents for different tenants
+        print(f"\n1. Ingesting document for {tenant1}...")
+        response = requests.post(
+            f"{BASE_URL}/rag/ingest-document",
+            headers={"x-tenant-id": tenant1, "Content-Type": "application/json"},
+            json={
+                "content": "This is a confidential document for Tenant 1 only. Secret code: TENANT1_SECRET_12345",
+                "source_type": "raw_text"
+            },
+            timeout=10
+        )
+        print(f"   Status: {response.status_code}")
+        if response.status_code != 200:
+            print(f"   Error: {response.text}")
+        print(f"\n2. Ingesting document for {tenant2}...")
+        response = requests.post(
+            f"{BASE_URL}/rag/ingest-document",
+            headers={"x-tenant-id": tenant2, "Content-Type": "application/json"},
+            json={
+                "content": "This is a confidential document for Tenant 2 only. Secret code: TENANT2_SECRET_67890",
+                "source_type": "raw_text"
+            },
+            timeout=10
+        )
+        print(f"   Status: {response.status_code}")
+        if response.status_code != 200:
+            print(f"   Error: {response.text}")
+        # List documents for tenant1
+        print(f"\n3. Listing documents for {tenant1}...")
+        response = requests.get(
+            f"{BASE_URL}/rag/list",
+            headers={"x-tenant-id": tenant1},
+            timeout=5
+        )
+        tenant1_docs = response.json().get("documents", [])
+        print(f"   Found {len(tenant1_docs)} documents")
+        # List documents for tenant2
+        print(f"\n4. Listing documents for {tenant2}...")
+        response = requests.get(
+            f"{BASE_URL}/rag/list",
+            headers={"x-tenant-id": tenant2},
+            timeout=5
+        )
+        tenant2_docs = response.json().get("documents", [])
+        print(f"   Found {len(tenant2_docs)} documents")
+        # Search for tenant1's secret
+        print(f"\n5. Searching for tenant1's secret as tenant1...")
+        response = requests.post(
+            f"{BASE_URL}/rag/search",
+            headers={"x-tenant-id": tenant1, "Content-Type": "application/json"},
+            json={"query": "TENANT1_SECRET"},
+            timeout=10
+        )
+        tenant1_search = response.json()
+        # Check only the result texts, not the entire JSON (which includes the query)
+        tenant1_results = tenant1_search.get("results", [])
+        tenant1_found = False
+        for result in tenant1_results:
+            result_text = result.get("text", "") or result.get("content", "") or str(result)
+            if "TENANT1_SECRET" in result_text:
+                tenant1_found = True
+                break
+        print(f"   Found: {tenant1_found}")
+        if tenant1_results:
+            print(f"   Results count: {len(tenant1_results)}")
+            if tenant1_results:
+                print(f"   First result preview: {str(tenant1_results[0].get('text', ''))[:100]}...")
+        # Search for tenant1's secret as tenant2 (should NOT find it)
+        print(f"\n6. Searching for tenant1's secret as tenant2 (should NOT find)...")
+        response = requests.post(
+            f"{BASE_URL}/rag/search",
+            headers={"x-tenant-id": tenant2, "Content-Type": "application/json"},
+            json={"query": "TENANT1_SECRET"},
+            timeout=10
+        )
+        tenant2_search = response.json()
+        # Check results more carefully
+        tenant2_results = tenant2_search.get("results", [])
+        tenant2_found = False
+        tenant2_found_texts = []
+        for result in tenant2_results:
+            result_text = result.get("text", "") or result.get("content", "") or str(result)
+            if "TENANT1_SECRET" in result_text:
+                tenant2_found = True
+                tenant2_found_texts.append(result_text[:100])
+        print(f"   Found: {tenant2_found}")
+        print(f"   Results count: {len(tenant2_results)}")
+        if tenant2_results:
+            print(f"   First result preview: {str(tenant2_results[0])[:150]}")
+        if tenant2_found_texts:
+            print(f"   ⚠️ Found TENANT1_SECRET in {len(tenant2_found_texts)} result(s):")
+            for i, text in enumerate(tenant2_found_texts, 1):
+                print(f"      {i}. {text}...")
+        # Verify isolation
+        print("\n7. Verifying isolation...")
+        if tenant1_found and not tenant2_found:
+            print("   ✅ Tenant1 can find their own secret")
+            print("   ✅ Tenant2 cannot find tenant1's secret")
+            print("\n✅ RAG Isolation: PASSED")
+            return True
+        elif tenant1_found and tenant2_found:
+            print("   ❌ Tenant2 can see tenant1's secret - ISOLATION FAILED!")
+            print(f"   Debug: tenant2 found {len(tenant2_found_texts)} result(s) containing TENANT1_SECRET")
+            print("\n❌ RAG Isolation: FAILED")
+            return False
+        else:
+            print("   ⚠️ Could not verify (may need RAG server running)")
+            print("\n⚠️ RAG Isolation: INCONCLUSIVE")
+            return None
+    except requests.exceptions.ConnectionError:
+        print("\n⚠️ Cannot connect to API/RAG server. Make sure they're running:")
+        print("   uvicorn backend.api.main:app --port 8000")
+        print("   python -m backend.mcp_servers.rag_server")
+        return None
+    except Exception as e:
+        print(f"\n❌ Error: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def verify_database_directly():
+    """Verify tenant_id in database directly"""
+    print_section("Verifying Database Directly")
+    try:
+        from api.storage.analytics_store import AnalyticsStore
+        from api.storage.rules_store import RulesStore
+        # Check analytics store
+        print("\n1. Checking Analytics Store...")
+        analytics = AnalyticsStore()
+        # Log events for different tenants
+        analytics.log_tool_usage("db_verify_tenant1", "rag", latency_ms=100)
+        analytics.log_tool_usage("db_verify_tenant2", "web", latency_ms=200)
+        # Get stats
+        tenant1_stats = analytics.get_tool_usage_stats("db_verify_tenant1")
+        tenant2_stats = analytics.get_tool_usage_stats("db_verify_tenant2")
+        print(f"   Tenant1 stats: {list(tenant1_stats.keys())}")
+        print(f"   Tenant2 stats: {list(tenant2_stats.keys())}")
+        # Check rules store
+        print("\n2. Checking Rules Store...")
+        rules = RulesStore()
+        rules.add_rule("db_verify_tenant1", "Rule 1", severity="high")
+        rules.add_rule("db_verify_tenant2", "Rule 2", severity="low")
+        tenant1_rules = rules.get_rules("db_verify_tenant1")
+        tenant2_rules = rules.get_rules("db_verify_tenant2")
+        print(f"   Tenant1 rules: {tenant1_rules}")
+        print(f"   Tenant2 rules: {tenant2_rules}")
+        # Verify isolation
+        print("\n3. Verifying isolation...")
+        tenant1_has_rule1 = "Rule 1" in tenant1_rules
+        tenant1_has_rule2 = "Rule 2" in tenant1_rules
+        tenant2_has_rule1 = "Rule 1" in tenant2_rules
+        tenant2_has_rule2 = "Rule 2" in tenant2_rules
+        print(f"   Tenant1 has Rule 1: {tenant1_has_rule1} ✓")
+        print(f"   Tenant1 has Rule 2: {tenant1_has_rule2} {'✗ FAILED!' if tenant1_has_rule2 else '✓ PASSED'}")
+        print(f"   Tenant2 has Rule 1: {tenant2_has_rule1} {'✗ FAILED!' if tenant2_has_rule1 else '✓ PASSED'}")
+        print(f"   Tenant2 has Rule 2: {tenant2_has_rule2} ✓")
+        if tenant1_has_rule1 and not tenant1_has_rule2 and not tenant2_has_rule1 and tenant2_has_rule2:
+            print("\n✅ Database Direct Verification: PASSED")
+            return True
+        else:
+            print("\n❌ Database Direct Verification: FAILED")
+            return False
+    except Exception as e:
+        print(f"\n❌ Error: {e}")
+        import traceback
+        traceback.print_exc()
+        return False
+def main():
+    """Run all verification tests"""
+    print("\n" + "🔍" * 30)
+    print("Tenant ID Isolation Verification")
+    print("🔍" * 30)
+    results = []
+    # Test 1: Database direct verification (always runs, no API needed)
+    print("\n📊 Running database direct verification (no API required)...")
+    result = verify_database_directly()
+    if result is not None:
+        results.append(result)
+    # Test 2: Admin rules isolation (requires API running)
+    print("\n📋 Testing admin rules isolation (requires API)...")
+    result = verify_admin_rules_isolation()
+    if result is not None:
+        results.append(result)
+    # Test 3: Analytics isolation (requires API running)
+    print("\n📈 Testing analytics isolation (requires API)...")
+    result = verify_analytics_isolation()
+    if result is not None:
+        results.append(result)
+    # Test 4: RAG isolation (requires API and RAG server running)
+    print("\n📚 Testing RAG document isolation (requires API + RAG server)...")
+    result = verify_rag_isolation()
+    if result is not None:
+        results.append(result)
+    # Summary
+    print_section("Verification Summary")
+    passed = sum(1 for r in results if r is True)
+    failed = sum(1 for r in results if r is False)
+    total = len(results)
+    print(f"\nTests Completed: {total}")
+    print(f"✅ Passed: {passed}")
+    print(f"❌ Failed: {failed}")
+    if total == 0:
+        print("\n⚠️ No tests could run. Make sure services are running:")
+        print("   - API: uvicorn backend.api.main:app --port 8000")
+        print("   - RAG Server: python -m backend.mcp_servers.rag_server")
+    elif failed == 0 and passed > 0:
+        print("\n✅ All tenant isolation tests PASSED!")
+    elif failed > 0:
+        print("\n❌ Some tenant isolation tests FAILED!")
+    else:
+        print("\n⚠️ Some tests were inconclusive or skipped")
+if __name__ == "__main__":
+    main()