Spaces:

YashashviAlva
/

codeSentry

Running

App Files Files Community

codeSentry / codesentry-backend /agents /orchestrator.py

YashashviAlva

Fix HF Spaces streaming timeouts and error handling

43efb12 4 days ago

raw

history blame contribute delete

18.4 kB

	"""
	Orchestrator — coordinates Security → Performance → Fix agents
	and emits SSE events for real-time streaming to the frontend.
	"""
	from __future__ import annotations

	import asyncio
	import logging
	import os
	import time
	from typing import Any, AsyncGenerator, Dict, List, Optional

	from api.models import (
	AMDMigrationGuide,
	AMDMigrationFindingModel,
	AnalysisSummary,
	PerformanceFinding,
	PrivacyCertificate,
	SecurityFinding,
	SessionResult,
	Severity,
	)
	from agents.security_agent import SecurityAgent
	from agents.performance_agent import PerformanceAgent
	from agents.fix_agent import FixAgent
	from agents.amd_migration_advisor import AMDMigrationAdvisor
	from amd_metrics import AMDMetricsCollector
	from memory.session_store import get_store
	from privacy.privacy_guard import ZeroDataRetentionGuard
	from tools.code_parser import (
	FileEntry,
	build_context_block,
	parse_code_string,
	parse_directory,
	parse_zip_base64,
	)
	from tools.github_connector import GitHubConnector
	from tools.benchmark_tool import start_benchmark, record_first_finding, finish_benchmark

	logger = logging.getLogger(__name__)

	# Config from environment
	VLLM_BASE_URL = os.getenv("VLLM_BASE_URL", "http://localhost:8080/v1")
	MODEL_NAME = os.getenv("MODEL_NAME", "Qwen/Qwen2.5-Coder-32B-Instruct")
	LLM_API_KEY = os.getenv("LLM_API_KEY") or os.getenv("GROQ_API_KEY", "not-needed-local")
	USE_LLM = os.getenv("USE_LLM", "true").lower() == "true"


	def _sse_event(event: str, data: Dict[str, Any]) -> Dict[str, Any]:
	return {"event": event, "data": data}


	class Orchestrator:
	"""
	Master agent. Runs the full analysis pipeline:
	1. Ingest code (GitHub / string / zip)
	2. Security Agent (static + LLM)
	3. Performance Agent (static + LLM)
	4. Fix Agent (diffs + report)
	5. Privacy certificate generation

	Yields SSE event dicts throughout for real-time streaming.
	"""

	def __init__(self) -> None:
	self.security_agent = SecurityAgent(
	vllm_base_url=VLLM_BASE_URL,
	model=MODEL_NAME,
	api_key=LLM_API_KEY
	)
	self.performance_agent = PerformanceAgent(
	vllm_base_url=VLLM_BASE_URL,
	model=MODEL_NAME,
	api_key=LLM_API_KEY
	)
	self.fix_agent = FixAgent(
	vllm_base_url=VLLM_BASE_URL,
	model=MODEL_NAME,
	api_key=LLM_API_KEY
	)
	self.migration_advisor = AMDMigrationAdvisor()
	self.metrics_collector = AMDMetricsCollector()
	self.store = get_store()

	# ──────────────────────────────────────────
	# SSE streaming pipeline
	# ──────────────────────────────────────────

	async def run_stream(
	self,
	source: str,
	source_type: str,
	session_id: str,
	) -> AsyncGenerator[Dict[str, Any], None]:
	"""
	Full analysis pipeline yielding SSE event dicts.
	Call from a FastAPI StreamingResponse / EventSourceResponse.
	"""
	start_time = time.perf_counter()
	bench = start_benchmark()
	self.metrics_collector.reset_tokens()

	# Update session
	await self.store.update(session_id, {"source_type": source_type, "status": "running"})

	# ── AMD Metrics background poller ────────────────────
	metrics_queue: asyncio.Queue = asyncio.Queue()
	metrics_stop = asyncio.Event()

	async def _poll_amd_metrics() -> None:
	"""Collect AMD GPU metrics every 2 seconds."""
	try:
	while not metrics_stop.is_set():
	snapshot = await self.metrics_collector.collect()
	await metrics_queue.put(snapshot)
	await asyncio.sleep(2)
	except asyncio.CancelledError:
	pass
	except Exception as exc:
	logger.debug("[Orchestrator] AMD metrics polling error: %s", exc)

	metrics_task = asyncio.create_task(_poll_amd_metrics())

	with ZeroDataRetentionGuard(session_id=session_id, enforce_network_block=False) as guard:
	# ── Step 1: Ingest ───────────────────────────────────
	yield _sse_event("status", {"message": "Ingesting code...", "session_id": session_id})

	try:
	files = await asyncio.to_thread(self._ingest, source, source_type)
	except Exception as exc:
	metrics_stop.set()
	metrics_task.cancel()
	yield _sse_event("error", {"message": f"Ingestion failed: {exc}"})
	await self.store.set_status(session_id, "error")
	return

	yield _sse_event("status", {
	"message": f"Loaded {len(files)} file(s)",
	"files_count": len(files),
	})

	code_context = build_context_block(files)

	# Drain any queued AMD metrics
	while not metrics_queue.empty():
	try:
	snapshot = metrics_queue.get_nowait()
	yield _sse_event("amd_metrics", snapshot)
	except asyncio.QueueEmpty:
	break

	# ── Step 2: Security Agent ───────────────────────────
	yield _sse_event("agent_start", {"agent": "security", "status": "scanning"})

	# Static scan first (fast)
	static_security = await asyncio.to_thread(
	self.security_agent.static_scan, files
	)
	for i, finding in enumerate(static_security):
	finding.id = f"SEC-STATIC-{i+1}"
	record_first_finding(bench)
	yield _sse_event("finding", {
	"agent": "security",
	**finding.model_dump(),
	})
	await asyncio.sleep(0) # yield control to event loop

	# Drain AMD metrics between agents
	while not metrics_queue.empty():
	try:
	yield _sse_event("amd_metrics", metrics_queue.get_nowait())
	except asyncio.QueueEmpty:
	break

	# LLM deep scan
	if USE_LLM:
	llm_security = await self.security_agent.llm_scan(code_context, static_security)
	# Merge with static
	security_findings = self.security_agent._merge_findings(static_security, llm_security)
	security_findings = self.security_agent._sort_by_severity(security_findings)
	# Emit LLM-enriched findings
	for i, finding in enumerate(llm_security):
	finding.id = f"SEC-LLM-{i+1}"
	record_first_finding(bench)
	yield _sse_event("finding", {
	"agent": "security",
	**finding.model_dump(),
	})
	await asyncio.sleep(0)
	else:
	security_findings = static_security

	yield _sse_event("agent_complete", {
	"agent": "security",
	"findings_count": len(security_findings),
	})

	# ── Step 3: Performance Agent ────────────────────────
	yield _sse_event("agent_start", {"agent": "performance", "status": "analyzing"})

	perf_findings = await self.performance_agent.analyze(
	files, code_context, use_llm=USE_LLM
	)

	for i, pf in enumerate(perf_findings):
	pf.id = f"PERF-{i+1}"
	yield _sse_event("finding", {
	"agent": "performance",
	"type": pf.type.value,
	"saving_mb": pf.saving_mb or 0,
	"suggestion": pf.suggestion,
	**pf.model_dump(),
	})
	await asyncio.sleep(0)

	yield _sse_event("agent_complete", {
	"agent": "performance",
	"optimizations_count": len(perf_findings),
	})

	# Drain AMD metrics
	while not metrics_queue.empty():
	try:
	yield _sse_event("amd_metrics", metrics_queue.get_nowait())
	except asyncio.QueueEmpty:
	break

	# ── Step 3.5: AMD Migration Advisor ──────────────────
	amd_migration_result: Optional[Dict] = None
	try:
	amd_migration_result = await self.migration_advisor.scan(files)
	for mf in amd_migration_result.get("findings", []):
	yield _sse_event("amd_migration_finding", mf)
	await asyncio.sleep(0.05)
	yield _sse_event("amd_migration_summary", {
	"compatibility_score": amd_migration_result["compatibility_score"],
	"compatibility_label": amd_migration_result["compatibility_label"],
	"total_cuda_patterns_found": amd_migration_result["total_cuda_patterns_found"],
	"summary": amd_migration_result["summary"],
	})
	except Exception as exc:
	logger.warning("[Orchestrator] AMD migration scan failed: %s", exc)

	# ── Step 4: Fix Agent ────────────────────────────────
	yield _sse_event("agent_start", {"agent": "fix", "status": "generating_fixes"})

	fix_result = await self.fix_agent.generate_fixes(
	files=files,
	security_findings=security_findings,
	performance_findings=perf_findings,
	session_id=session_id,
	use_llm=USE_LLM,
	)

	# Emit individual fixes for the UI
	for fix in fix_result.finding_fixes:
	yield _sse_event("fix_ready", fix.model_dump())
	await asyncio.sleep(0.1) # tiny delay for UI animation

	yield _sse_event("fix_batch", {
	"diff": fix_result.diffs[0].diff if fix_result.diffs else "",
	"files_changed": fix_result.files_changed,
	"diffs": [d.model_dump() for d in fix_result.diffs],
	})

	# ── Step 5: Summary & Certificate ───────────────────
	# Stop AMD metrics polling
	metrics_stop.set()
	metrics_task.cancel()

	bench = finish_benchmark(bench, findings=len(security_findings))
	elapsed = time.perf_counter() - start_time

	sev_counts = {s.value: 0 for s in Severity}
	for f in security_findings:
	sev_counts[f.severity.value] += 1

	total_mem_saving = sum((pf.saving_mb or 0.0) for pf in perf_findings)

	summary = AnalysisSummary(
	session_id=session_id,
	total_findings=len(security_findings),
	critical_count=sev_counts.get("critical", 0),
	high_count=sev_counts.get("high", 0),
	medium_count=sev_counts.get("medium", 0),
	low_count=sev_counts.get("low", 0),
	performance_optimizations=len(perf_findings),
	estimated_memory_savings_mb=total_mem_saving,
	analysis_duration_seconds=round(elapsed, 2),
	files_analyzed=len(files),
	)

	cert_dict = guard.generate_certificate()
	privacy_cert = PrivacyCertificate(
	session_id=cert_dict["session_id"],
	timestamp=cert_dict["timestamp"],
	guarantee=cert_dict["guarantee"],
	model_endpoint=cert_dict["model_endpoint"],
	external_calls_blocked=cert_dict.get("external_calls_blocked", []),
	data_wiped=cert_dict["data_wiped"],
	signature=cert_dict["signature"],
	)

	# Build AMD migration guide for the final result
	amd_guide = None
	if amd_migration_result:
	try:
	amd_guide = AMDMigrationGuide(
	compatibility_score=amd_migration_result["compatibility_score"],
	compatibility_label=amd_migration_result["compatibility_label"],
	total_cuda_patterns_found=amd_migration_result["total_cuda_patterns_found"],
	findings=[
	AMDMigrationFindingModel(**f)
	for f in amd_migration_result.get("findings", [])
	],
	summary=amd_migration_result.get("summary", ""),
	)
	except Exception as exc:
	logger.debug("[Orchestrator] AMDMigrationGuide build failed: %s", exc)

	# Persist full result to session store
	session_result = SessionResult(
	session_id=session_id,
	status="complete",
	summary=summary,
	security_findings=security_findings,
	performance_findings=perf_findings,
	fix_result=fix_result,
	privacy_certificate=privacy_cert,
	amd_migration_guide=amd_guide,
	)
	await self.store.update(session_id, {
	"_status": "complete",
	"result": session_result.model_dump(mode="json"),
	})

	yield _sse_event("complete", {
	"privacy_certificate": privacy_cert.model_dump(),
	"summary": summary.model_dump(),
	"security_report_available": True,
	"amd_migration_guide": amd_guide.model_dump() if amd_guide else None,
	})

	# ──────────────────────────────────────────
	# Code ingestion
	# ──────────────────────────────────────────

	def _ingest(self, source: str, source_type: str) -> List[FileEntry]:
	"""Route ingestion to the correct parser based on source_type."""
	if source_type == "github":
	with GitHubConnector(source) as repo_dir:
	return parse_directory(repo_dir)
	elif source_type == "huggingface":
	from tools.huggingface_connector import HuggingFaceConnector
	with HuggingFaceConnector(source) as repo_dir:
	return parse_directory(repo_dir)
	elif source_type == "zip":
	return parse_zip_base64(source)
	elif source_type == "code":
	return parse_code_string(source, filename="input.py")
	else:
	raise ValueError(f"Unknown source_type: {source_type!r}")

	# ──────────────────────────────────────────
	# Demo mode (pre-computed, no GPU needed)
	# ──────────────────────────────────────────

	async def run_demo(self, session_id: str = "demo") -> SessionResult:
	"""
	Return a pre-computed demo result using the vulnerable_ml_code fixture.
	Works without a GPU or vLLM server.
	"""
	import pathlib

	fixture_path = (
	pathlib.Path(__file__).parent.parent
	/ "tests" / "fixtures" / "vulnerable_ml_code.py"
	)
	code = fixture_path.read_text(encoding="utf-8") if fixture_path.exists() else DEMO_CODE

	files: List[FileEntry] = [("vulnerable_ml_code.py", code)]
	code_context = build_context_block(files)

	# Static-only analysis (no LLM) for demo
	security_findings = self.security_agent.static_scan(files)
	perf_findings = self.performance_agent.static_scan(files)
	fix_result = await self.fix_agent.generate_fixes(
	files, security_findings, perf_findings, session_id, use_llm=False
	)

	sev_counts = {s.value: 0 for s in Severity}
	for f in security_findings:
	sev_counts[f.severity.value] += 1

	summary = AnalysisSummary(
	session_id=session_id,
	total_findings=len(security_findings),
	critical_count=sev_counts.get("critical", 0),
	high_count=sev_counts.get("high", 0),
	medium_count=sev_counts.get("medium", 0),
	low_count=sev_counts.get("low", 0),
	performance_optimizations=len(perf_findings),
	estimated_memory_savings_mb=sum((p.saving_mb or 0) for p in perf_findings),
	analysis_duration_seconds=0.5,
	files_analyzed=1,
	)

	cert = PrivacyCertificate(
	session_id=session_id,
	timestamp="demo",
	guarantee="Demo mode — all inference ran locally (static analysis only).",
	model_endpoint="http://localhost:8080",
	external_calls_blocked=[],
	data_wiped=True,
	signature="demo-signature",
	)

	return SessionResult(
	session_id=session_id,
	status="complete",
	summary=summary,
	security_findings=security_findings,
	performance_findings=perf_findings,
	fix_result=fix_result,
	privacy_certificate=cert,
	)


	# Minimal inline demo code (fallback if fixture file missing)
	DEMO_CODE = '''
	import pickle, os
	from flask import Flask, request
	app = Flask(__name__)
	HF_TOKEN = "hf_abcdefghijklmnopqrstuvwxyz123456"

	@app.route("/predict", methods=["POST"])
	def predict():
	model_path = request.json["model_path"]
	model = pickle.load(open(model_path, "rb")) # CWE-502
	user_prompt = request.json["prompt"]
	result = model.generate(f"Answer: {user_prompt}") # LLM01
	eval(result) # LLM02
	return {"result": result}
	'''