Spaces:

holistic-ai
/

AgentGraph

Sleeping

App Files Files Community

AgentGraph / backend /routers /traces.py

wu981526092

Security: Fix critical vulnerabilities before public release

bcbd2ec 30 days ago

raw

history blame contribute delete

48.1 kB

	"""
	API endpoints for working with traces
	"""

	from fastapi import APIRouter, Depends, HTTPException, UploadFile, File, Form, BackgroundTasks, Body
	from typing import List, Dict, Any, Optional
	from sqlalchemy.orm import Session
	import logging
	from datetime import datetime
	from pydantic import BaseModel
	import time

	from backend.dependencies import get_db
	from backend.database.utils import get_all_traces, get_trace, delete_trace, get_knowledge_graphs_for_trace, save_trace, update_trace_content
	from backend.services.context_service import ContextService
	from backend.services.cost_calculation_service import cost_service
	from backend.models import (
	ContextDocument,
	CreateContextRequest,
	UpdateContextRequest,
	ContextDocumentResponse,
	ContextDocumentType
	)
	from backend.services.trace_management_service import TraceManagementService
	from backend.services.processing_service import process_trace_task, PipelineError
	from backend.services.task_service import create_task

	logger = logging.getLogger(__name__)

	router = APIRouter(
	prefix="/api/traces",
	tags=["traces"],
	)

	def update_kg_statistics(session: Session, kg_list: List) -> None:
	"""
	Update entity_count and relation_count for knowledge graphs if they're missing but graph_data exists.

	Args:
	session: Database session
	kg_list: List of knowledge graph database objects
	"""
	updated_count = 0

	for kg in kg_list:
	if kg and kg.graph_data:
	needs_update = False

	# Update entity count if missing/zero but entities exist in graph_data
	if kg.entity_count is None or kg.entity_count == 0:
	entities = kg.graph_data.get("entities", [])
	if entities:
	kg.entity_count = len(entities)
	needs_update = True

	# Update relation count if missing/zero but relations exist in graph_data
	if kg.relation_count is None or kg.relation_count == 0:
	relations = kg.graph_data.get("relations", [])
	if relations:
	kg.relation_count = len(relations)
	needs_update = True

	if needs_update:
	session.add(kg)
	updated_count += 1

	if updated_count > 0:
	session.commit()
	logging.getLogger("agent_monitoring_server").info(f"Updated entity/relation counts for {updated_count} knowledge graphs")

	@router.get("/")
	async def list_traces(db: Session = Depends(get_db)):
	"""
	List all traces stored in the database with their associated knowledge graphs.
	"""
	traces = get_all_traces(db)

	# Convert to a list of dictionaries and include knowledge graphs
	trace_list = []
	for trace in traces:
	# Get related knowledge graphs for each trace
	knowledge_graphs = get_knowledge_graphs_for_trace(db, trace.trace_id)

	# Convert knowledge graphs to proper dict format with is_final field
	kg_list = []
	for kg in knowledge_graphs:
	# Extract processing metadata from graph_data if available
	processing_metadata = {}
	system_info = {}
	if kg.graph_data and isinstance(kg.graph_data, dict):
	metadata = kg.graph_data.get("metadata", {})
	processing_params = metadata.get("processing_params", {})
	processing_metadata = {
	"method_name": processing_params.get("method_name", "unknown"),
	"splitter_type": processing_params.get("splitter_type", "unknown"),
	"window_size": processing_params.get("window_size", "unknown"),
	"overlap_size": processing_params.get("overlap_size", "unknown")
	}
	system_info = {
	"system_name": kg.graph_data.get("system_name"),
	"system_summary": kg.graph_data.get("system_summary"),
	"graph_data": kg.graph_data
	}

	# Determine if this is a final KG using the same logic as the specific endpoint
	is_final = (kg.window_index is None and kg.window_total is not None)

	kg_dict = {
	"kg_id": kg.id,
	"id": kg.id,
	"filename": kg.filename,
	"created_at": kg.creation_timestamp.isoformat() if kg.creation_timestamp else None,
	"status": kg.status,
	"is_final": is_final,
	"window_index": kg.window_index,
	"window_total": kg.window_total,
	"window_start_char": kg.window_start_char,
	"window_end_char": kg.window_end_char,
	"processing_run_id": kg.processing_run_id,
	"entity_count": kg.entity_count or 0,
	"relation_count": kg.relation_count or 0,
	"is_enriched": kg.status == "enriched" or kg.status == "perturbed" or kg.status == "analyzed",
	"is_perturbed": kg.status == "perturbed" or kg.status == "analyzed",
	"is_analyzed": kg.status == "analyzed",
	"processing_metadata": processing_metadata,
	"system_name": system_info.get("system_name"),
	"system_summary": system_info.get("system_summary"),
	"graph_data": system_info.get("graph_data"),
	}
	kg_list.append(kg_dict)

	# Prepare the trace response with knowledge graphs
	trace_dict = trace.to_dict()
	trace_dict["knowledge_graphs"] = kg_list
	trace_list.append(trace_dict)

	return {
	"status": "success",
	"traces": trace_list
	}

	@router.post("/")
	async def upload_trace(
	trace_file: UploadFile = File(...),
	db: Session = Depends(get_db)
	):
	"""
	Upload a trace file to the database.

	Args:
	trace_file: The trace file to upload
	db: Database session

	Returns:
	Status and trace ID
	"""
	try:
	# Read the uploaded file content
	file_content = await trace_file.read()
	file_content_str = file_content.decode('utf-8')

	try:
	# Import trace analysis utilities
	from agentgraph.input.trace_management import analyze_trace_characteristics

	# Analyze the trace to determine its characteristics
	trace_analysis = analyze_trace_characteristics(file_content_str)

	# Save the trace to the database
	trace = save_trace(
	session=db,
	content=file_content_str,
	filename=trace_file.filename,
	title=f"Trace from {trace_file.filename}",
	description=f"Uploaded via Stage Processor on {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}",
	trace_type=trace_analysis.get('trace_type', "user_upload"),
	trace_source="stage_processor",
	tags=["stage_processor"],
	trace_metadata=trace_analysis
	)

	logger = logging.getLogger("agent_monitoring_server")
	logger.info(f"Trace saved to database: ID={trace.id}, trace_id={trace.trace_id}")
	logger.info(f"Trace characteristics: {trace_analysis.get('trace_type', 'unknown')} type, " +
	f"{trace_analysis.get('line_count', 0)} lines, {trace_analysis.get('total_length', 0)} chars")

	# Auto-generate context documents using universal parser
	context_docs_created = 0
	try:
	from backend.services.universal_parser_service import auto_generate_context_documents
	created_docs = auto_generate_context_documents(trace.trace_id, file_content_str, db)
	context_docs_created = len(created_docs)
	if context_docs_created > 0:
	logger.info(f"Auto-generated {context_docs_created} context documents for trace {trace.trace_id}")
	except Exception as e:
	logger.warning(f"Failed to auto-generate context documents for trace {trace.trace_id}: {str(e)}")

	return {
	"status": "success",
	"message": "Trace uploaded successfully",
	"trace_id": trace.trace_id,
	"title": trace.title,
	"character_count": trace.character_count,
	"turn_count": trace.turn_count,
	"context_documents_generated": context_docs_created
	}

	except ImportError:
	# Fall back to basic trace saving if trace_uploader is not available
	logger = logging.getLogger("agent_monitoring_server")
	logger.warning("Could not import trace analysis utilities")

	# Save the trace to the database without analysis
	trace = save_trace(
	session=db,
	content=file_content_str,
	filename=trace_file.filename,
	title=f"Trace from {trace_file.filename}",
	trace_type="user_upload",
	trace_source="stage_processor",
	tags=["stage_processor"]
	)

	logger.info(f"Trace saved to database: ID={trace.id}, trace_id={trace.trace_id}")

	# Auto-generate context documents using universal parser
	context_docs_created = 0
	try:
	from backend.services.universal_parser_service import auto_generate_context_documents
	created_docs = auto_generate_context_documents(trace.trace_id, file_content_str, db)
	context_docs_created = len(created_docs)
	if context_docs_created > 0:
	logger.info(f"Auto-generated {context_docs_created} context documents for trace {trace.trace_id}")
	except Exception as e:
	logger.warning(f"Failed to auto-generate context documents for trace {trace.trace_id}: {str(e)}")

	return {
	"status": "success",
	"message": "Trace uploaded successfully",
	"trace_id": trace.trace_id,
	"title": trace.title,
	"character_count": trace.character_count,
	"turn_count": trace.turn_count,
	"context_documents_generated": context_docs_created
	}

	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error uploading trace: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while uploading trace")

	@router.get("/{trace_id}")
	async def get_trace_by_id(trace_id: str, db: Session = Depends(get_db)):
	"""
	Get a specific trace by ID.
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	# Get related knowledge graphs
	knowledge_graphs = get_knowledge_graphs_for_trace(db, trace.trace_id)

	# Convert knowledge graphs to proper dict format with is_final field
	kg_list = []
	for kg in knowledge_graphs:
	# Extract processing metadata from graph_data if available
	processing_metadata = {}
	system_info = {}
	if kg.graph_data and isinstance(kg.graph_data, dict):
	metadata = kg.graph_data.get("metadata", {})
	processing_params = metadata.get("processing_params", {})
	processing_metadata = {
	"method_name": processing_params.get("method_name", "unknown"),
	"splitter_type": processing_params.get("splitter_type", "unknown"),
	"window_size": processing_params.get("window_size", "unknown"),
	"overlap_size": processing_params.get("overlap_size", "unknown")
	}
	system_info = {
	"system_name": kg.graph_data.get("system_name"),
	"system_summary": kg.graph_data.get("system_summary"),
	"graph_data": kg.graph_data
	}

	# Determine if this is a final KG using the same logic as the specific endpoint
	is_final = (kg.window_index is None and kg.window_total is not None)

	kg_dict = {
	"kg_id": kg.id,
	"id": kg.id,
	"filename": kg.filename,
	"created_at": kg.creation_timestamp.isoformat() if kg.creation_timestamp else None,
	"status": kg.status,
	"is_final": is_final,
	"window_index": kg.window_index,
	"window_total": kg.window_total,
	"window_start_char": kg.window_start_char,
	"window_end_char": kg.window_end_char,
	"processing_run_id": kg.processing_run_id,
	"entity_count": kg.entity_count or 0,
	"relation_count": kg.relation_count or 0,
	"is_enriched": kg.status == "enriched" or kg.status == "perturbed" or kg.status == "analyzed",
	"is_perturbed": kg.status == "perturbed" or kg.status == "analyzed",
	"is_analyzed": kg.status == "analyzed",
	"processing_metadata": processing_metadata,
	"system_name": system_info.get("system_name"),
	"system_summary": system_info.get("system_summary"),
	"graph_data": system_info.get("graph_data"),
	}
	kg_list.append(kg_dict)

	# Prepare the response
	result = trace.to_dict()
	result["knowledge_graphs"] = kg_list

	return {
	"status": "success",
	"trace": result
	}

	@router.delete("/{trace_id}")
	async def delete_trace_by_id(
	trace_id: str,
	delete_related_kgs: bool = False,
	db: Session = Depends(get_db)
	):
	"""
	Delete a trace by ID.
	"""
	success = delete_trace(db, trace_id, delete_related_kgs)

	if not success:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	return {
	"status": "success",
	"message": f"Trace {trace_id} deleted successfully"
	}

	@router.get("/{trace_id}/knowledge-graphs")
	async def get_knowledge_graphs_for_trace_id(trace_id: str, db: Session = Depends(get_db)):
	"""
	Get all knowledge graphs associated with a specific trace.
	Separates final merged KGs from individual window KGs and groups them appropriately.

	Args:
	trace_id: The ID of the trace
	db: Database session

	Returns:
	A list of final knowledge graphs with their associated window KGs nested underneath
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	try:
	# Get all knowledge graphs for this trace
	all_knowledge_graphs = get_knowledge_graphs_for_trace(db, trace.trace_id)

	# Update statistics for all knowledge graphs before processing
	update_kg_statistics(db, all_knowledge_graphs)

	# Separate final KGs from window KGs
	# Final KGs: window_index IS NULL AND window_total IS NOT NULL
	# Window KGs: window_index IS NOT NULL
	final_kgs = []
	window_kgs = []

	for kg in all_knowledge_graphs:
	if kg.window_index is None and kg.window_total is not None:
	# This is a final merged KG
	final_kgs.append(kg)
	elif kg.window_index is not None:
	# This is a window KG
	window_kgs.append(kg)
	# Skip KGs that don't fit either pattern (legacy or malformed)

	# Group window KGs by processing_run_id to associate them with final KGs
	window_kgs_by_run = {}
	for window_kg in window_kgs:
	run_id = window_kg.processing_run_id or 'legacy'
	if run_id not in window_kgs_by_run:
	window_kgs_by_run[run_id] = []
	window_kgs_by_run[run_id].append(window_kg)

	# Build the final response
	kg_list = []
	for final_kg in final_kgs:
	# Get associated window KGs for this final KG
	run_id = final_kg.processing_run_id or 'legacy'
	associated_windows = window_kgs_by_run.get(run_id, [])

	# Sort window KGs by window_index
	associated_windows.sort(key=lambda wkg: wkg.window_index if wkg.window_index is not None else 0)

	# Convert window KGs to dict format
	window_kg_list = []
	for window_kg in associated_windows:
	window_data = {
	"kg_id": window_kg.id,
	"filename": window_kg.filename,
	"window_index": window_kg.window_index,
	"window_start_char": window_kg.window_start_char,
	"window_end_char": window_kg.window_end_char,
	"created_at": window_kg.creation_timestamp.isoformat() if window_kg.creation_timestamp else None,
	"status": window_kg.status,
	"entity_count": window_kg.entity_count or 0,
	"relation_count": window_kg.relation_count or 0
	}
	window_kg_list.append(window_data)

	# Extract processing metadata from graph_data if available
	processing_metadata = {}
	if final_kg.graph_data and isinstance(final_kg.graph_data, dict):
	metadata = final_kg.graph_data.get("metadata", {})
	processing_params = metadata.get("processing_params", {})
	processing_metadata = {
	"method_name": processing_params.get("method_name", "unknown"),
	"splitter_type": processing_params.get("splitter_type", "unknown"),
	"window_size": processing_params.get("window_size", "unknown"),
	"overlap_size": processing_params.get("overlap_size", "unknown")
	}

	# Extract system information from graph_data
	system_info = {}
	if final_kg.graph_data and isinstance(final_kg.graph_data, dict):
	system_info = {
	"system_name": final_kg.graph_data.get("system_name"),
	"system_summary": final_kg.graph_data.get("system_summary"),
	"graph_data": final_kg.graph_data # Include full graph_data for frontend access
	}

	# Build final KG data
	final_kg_data = {
	"kg_id": final_kg.id,
	"filename": final_kg.filename,
	"created_at": final_kg.creation_timestamp.isoformat() if final_kg.creation_timestamp else None,
	"updated_at": final_kg.update_timestamp.isoformat() if final_kg.update_timestamp else None,
	"status": final_kg.status,
	"is_final": True,
	"window_total": final_kg.window_total,
	"window_index": final_kg.window_index, # Should be None for final KGs
	"processing_run_id": final_kg.processing_run_id,
	"entity_count": final_kg.entity_count or 0,
	"relation_count": final_kg.relation_count or 0,
	"is_enriched": final_kg.status == "enriched" or final_kg.status == "perturbed" or final_kg.status == "analyzed",
	"is_perturbed": final_kg.status == "perturbed" or final_kg.status == "analyzed",
	"is_analyzed": final_kg.status == "analyzed",
	"processing_metadata": processing_metadata, # Add processing metadata
	"system_name": system_info.get("system_name"), # Add system_name to top level
	"system_summary": system_info.get("system_summary"), # Add system_summary to top level
	"graph_data": system_info.get("graph_data"), # Add graph_data to top level
	"window_knowledge_graphs": window_kg_list
	}
	kg_list.append(final_kg_data)

	# Handle any orphaned window KGs (those without associated final KGs)
	processed_run_ids = {kg.processing_run_id or 'legacy' for kg in final_kgs}
	orphaned_windows = []

	for run_id, windows in window_kgs_by_run.items():
	if run_id not in processed_run_ids:
	orphaned_windows.extend(windows)

	# Add orphaned windows as individual entries (for backward compatibility)
	for orphaned_kg in orphaned_windows:
	# Extract processing metadata for orphaned KGs too
	orphaned_metadata = {}
	orphaned_system_info = {}
	if orphaned_kg.graph_data and isinstance(orphaned_kg.graph_data, dict):
	metadata = orphaned_kg.graph_data.get("metadata", {})
	processing_params = metadata.get("processing_params", {})
	orphaned_metadata = {
	"method_name": processing_params.get("method_name", "unknown"),
	"splitter_type": processing_params.get("splitter_type", "unknown"),
	"window_size": processing_params.get("window_size", "unknown"),
	"overlap_size": processing_params.get("overlap_size", "unknown")
	}
	orphaned_system_info = {
	"system_name": orphaned_kg.graph_data.get("system_name"),
	"system_summary": orphaned_kg.graph_data.get("system_summary"),
	"graph_data": orphaned_kg.graph_data
	}

	orphaned_data = {
	"kg_id": orphaned_kg.id,
	"filename": orphaned_kg.filename,
	"created_at": orphaned_kg.creation_timestamp.isoformat() if orphaned_kg.creation_timestamp else None,
	"updated_at": orphaned_kg.update_timestamp.isoformat() if orphaned_kg.update_timestamp else None,
	"status": orphaned_kg.status,
	"is_final": False, # Mark as not final
	"window_total": orphaned_kg.window_total,
	"window_index": orphaned_kg.window_index,
	"processing_run_id": orphaned_kg.processing_run_id,
	"entity_count": orphaned_kg.entity_count or 0,
	"relation_count": orphaned_kg.relation_count or 0,
	"is_enriched": orphaned_kg.status == "enriched" or orphaned_kg.status == "perturbed" or orphaned_kg.status == "analyzed",
	"is_perturbed": orphaned_kg.status == "perturbed" or orphaned_kg.status == "analyzed",
	"is_analyzed": orphaned_kg.status == "analyzed",
	"processing_metadata": orphaned_metadata, # Add processing metadata
	"system_name": orphaned_system_info.get("system_name"), # Add system_name to top level
	"system_summary": orphaned_system_info.get("system_summary"), # Add system_summary to top level
	"graph_data": orphaned_system_info.get("graph_data"), # Add graph_data to top level
	"window_knowledge_graphs": [] # No nested windows for orphaned KGs
	}
	kg_list.append(orphaned_data)

	# Sort final list by creation timestamp, newest first
	kg_list.sort(key=lambda kg: kg["created_at"] if kg["created_at"] else "", reverse=True)

	return {
	"status": "success",
	"knowledge_graphs": kg_list
	}
	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error retrieving knowledge graphs for trace {trace_id}: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while retrieving knowledge graphs")

	@router.get("/{trace_id}/content")
	async def get_trace_content(trace_id: str, db: Session = Depends(get_db)):
	"""
	Get the content of a specific trace by ID.

	Args:
	trace_id: The ID of the trace
	db: Database session

	Returns:
	The content of the trace
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	if not hasattr(trace, 'content') or not trace.content:
	raise HTTPException(status_code=404, detail=f"No content available for trace with ID {trace_id}")

	return {
	"status": "success",
	"content": trace.content
	}

	@router.post("/{trace_id}/content")
	async def update_trace_content(
	trace_id: str,
	content_data: dict = Body(...),
	db: Session = Depends(get_db)
	):
	"""
	Update the content of a specific trace by ID.

	Args:
	trace_id: The ID of the trace
	content_data: Dictionary containing the new content
	db: Database session

	Returns:
	Success status
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	# Extract content from request body
	if 'content' not in content_data:
	raise HTTPException(status_code=400, detail="Content field is required")

	new_content = content_data['content']

	# Update trace content
	trace.content = new_content

	# Update character count and other metadata
	trace.character_count = len(new_content)

	# Estimate turn count (approximate)
	turn_markers = [
	"user:", "assistant:", "system:", "human:", "ai:",
	"User:", "Assistant:", "System:", "Human:", "AI:"
	]
	turn_count = 0
	for marker in turn_markers:
	turn_count += new_content.count(marker)
	trace.turn_count = max(1, turn_count) # At least 1 turn

	# Update timestamp
	trace.update_timestamp = datetime.utcnow()

	# Save to database
	db.add(trace)
	db.commit()

	return {
	"status": "success",
	"message": "Trace content updated successfully"
	}



	@router.post("/{trace_id}/regenerate-metadata")
	async def regenerate_trace_metadata(
	trace_id: str,
	db: Session = Depends(get_db)
	) -> Dict[str, Any]:
	"""
	Regenerate metadata for a trace using the universal parser.

	Args:
	trace_id: The ID of the trace to regenerate metadata for
	db: Database session

	Returns:
	Success status and metadata info
	"""
	try:
	# Get the trace
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace {trace_id} not found")

	if not trace.content:
	raise HTTPException(status_code=400, detail="Trace has no content to analyze")

	# Use UniversalParserService to regenerate metadata
	from backend.services.universal_parser_service import UniversalParserService
	parser_service = UniversalParserService(db)

	# This will regenerate and store the schema_analytics metadata
	context_docs = parser_service.generate_trace_context_documents(trace_id, trace.content)

	# Refresh the trace to get updated metadata
	db.refresh(trace)

	logger = logging.getLogger("agent_monitoring_server")
	logger.info(f"Successfully regenerated metadata for trace {trace_id}")

	return {
	"status": "success",
	"message": "Trace metadata regenerated successfully",
	"context_documents_created": len(context_docs),
	"metadata_updated": bool(trace.trace_metadata and trace.trace_metadata.get("schema_analytics"))
	}

	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error regenerating metadata for trace {trace_id}: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while regenerating metadata")


	@router.post("/{trace_id}/fix-long-lines")
	async def fix_long_lines(
	trace_id: str,
	request_data: Dict[str, Any],
	db: Session = Depends(get_db)
	) -> Dict[str, Any]:
	"""
	Apply rule-based line splitting to a trace content.

	Args:
	trace_id: ID of the trace to process
	request_data: Request data containing max_line_length
	db: Database session

	Returns:
	Dictionary with processed content and metadata
	"""
	try:
	# Get the trace
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace {trace_id} not found")

	# Get max_line_length from request, default to 800
	max_line_length = request_data.get("max_line_length", 800)

	# Apply line splitting using ChunkingService
	from agentgraph.input.text_processing import ChunkingService
	chunking_service = ChunkingService()

	processed_content = chunking_service.fix_long_lines_in_content(
	trace.content, max_line_length
	)

	# Update the trace content in database
	update_trace_content(db, trace.trace_id, processed_content)

	# Calculate statistics
	original_lines = len(trace.content.split('\n'))
	processed_lines = len(processed_content.split('\n'))

	return {
	"success": True,
	"content": processed_content,
	"statistics": {
	"original_lines": original_lines,
	"processed_lines": processed_lines,
	"lines_added": processed_lines - original_lines,
	"max_line_length": max_line_length
	},
	"message": f"Applied line splitting: {original_lines} → {processed_lines} lines"
	}

	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error applying line splitting to trace {trace_id}: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while applying line splitting")

	@router.get("/{trace_id}/content-numbered")
	async def get_trace_content_numbered(trace_id: str, db: Session = Depends(get_db)):
	"""
	Return the trace content with line numbers already added using the same
	TraceLineNumberProcessor that the extraction pipeline employs.
	This guarantees front-end alignment with reference ranges.
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	if not hasattr(trace, "content") or not trace.content:
	raise HTTPException(status_code=404, detail="Trace has no content")

	try:
	from agentgraph.input.text_processing.trace_line_processor import TraceLineNumberProcessor

	processor = TraceLineNumberProcessor(max_line_length=120)
	numbered, _ = processor.add_line_numbers(trace.content)
	except Exception as err:
	logging.getLogger("agent_monitoring_server").error(
	f"Failed to generate numbered trace for {trace_id}: {err}"
	)
	raise HTTPException(status_code=500, detail="Failed to generate numbered trace")

	return {"status": "success", "content": numbered}


	# Context Documents Endpoints

	@router.post("/{trace_id}/context")
	async def create_context_document(
	trace_id: str,
	request: CreateContextRequest,
	db: Session = Depends(get_db)
	) -> ContextDocumentResponse:
	"""Create a new context document for a trace."""
	try:
	context_service = ContextService(db)
	document = context_service.create_context_document(
	trace_id=trace_id,
	title=request.title,
	document_type=request.document_type,
	content=request.content,
	file_name=request.file_name
	)
	return ContextDocumentResponse(
	success=True,
	message="Context document created successfully",
	data=document
	)
	except ValueError as e:
	raise HTTPException(status_code=400, detail=str(e))
	except Exception as e:
	raise HTTPException(status_code=500, detail="An internal error occurred while creating context document")


	@router.get("/{trace_id}/context")
	async def get_context_documents(
	trace_id: str,
	db: Session = Depends(get_db)
	) -> List[ContextDocument]:
	"""Get all context documents for a trace."""
	try:
	context_service = ContextService(db)
	documents = context_service.get_context_documents(trace_id)
	return documents
	except ValueError as e:
	raise HTTPException(status_code=404, detail=str(e))
	except Exception as e:
	raise HTTPException(status_code=500, detail="An internal error occurred while retrieving context documents")


	@router.put("/{trace_id}/context/{context_id}")
	async def update_context_document(
	trace_id: str,
	context_id: str,
	request: UpdateContextRequest,
	db: Session = Depends(get_db)
	) -> ContextDocumentResponse:
	"""Update an existing context document."""
	try:
	context_service = ContextService(db)
	document = context_service.update_context_document(
	trace_id=trace_id,
	context_id=context_id,
	updates=request
	)
	return ContextDocumentResponse(
	success=True,
	message="Context document updated successfully",
	data=document
	)
	except ValueError as e:
	raise HTTPException(status_code=404, detail=str(e))
	except Exception as e:
	raise HTTPException(status_code=500, detail="An internal error occurred while updating context document")


	@router.delete("/{trace_id}/context/{context_id}")
	async def delete_context_document(
	trace_id: str,
	context_id: str,
	db: Session = Depends(get_db)
	) -> ContextDocumentResponse:
	"""Delete a context document."""
	try:
	context_service = ContextService(db)
	success = context_service.delete_context_document(trace_id, context_id)
	return ContextDocumentResponse(
	success=success,
	message="Context document deleted successfully"
	)
	except ValueError as e:
	raise HTTPException(status_code=404, detail=str(e))
	except Exception as e:
	raise HTTPException(status_code=500, detail="An internal error occurred while deleting context document")


	@router.post("/{trace_id}/context/upload")
	async def upload_context_file(
	trace_id: str,
	file: UploadFile = File(...),
	title: str = Form(...),
	document_type: ContextDocumentType = Form(...),
	db: Session = Depends(get_db)
	) -> ContextDocumentResponse:
	"""Upload a file as a context document."""
	try:
	# Validate file type
	allowed_extensions = ['.txt', '.md', '.json', '.csv']
	if not any(file.filename.lower().endswith(ext) for ext in allowed_extensions):
	raise HTTPException(
	status_code=400,
	detail=f"File type not allowed. Supported types: {', '.join(allowed_extensions)}"
	)

	# Validate file size (1MB limit)
	if file.size > 1024 * 1024:
	raise HTTPException(status_code=400, detail="File size exceeds 1MB limit")

	# Read file content
	content = await file.read()
	file_content = content.decode('utf-8')

	context_service = ContextService(db)
	document = context_service.process_uploaded_file(
	file_content=file_content,
	trace_id=trace_id,
	title=title,
	document_type=document_type,
	file_name=file.filename
	)

	return ContextDocumentResponse(
	success=True,
	message="Context file uploaded successfully",
	data=document
	)
	except UnicodeDecodeError:
	raise HTTPException(status_code=400, detail="File must be UTF-8 encoded text")
	except ValueError as e:
	raise HTTPException(status_code=400, detail=str(e))
	except Exception as e:
	raise HTTPException(status_code=500, detail="An internal error occurred while uploading context file")


	@router.post("/{trace_id}/context/auto-generate")
	async def auto_generate_context_documents_endpoint(
	trace_id: str,
	force: bool = False,
	db: Session = Depends(get_db)
	) -> Dict[str, Any]:
	"""
	Auto-generate context documents for a trace using the universal parser.

	Args:
	trace_id: ID of the trace
	force: Whether to remove existing auto-generated context documents first
	db: Database session

	Returns:
	Status and information about generated context documents
	"""
	try:
	# Get the trace
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace {trace_id} not found")

	if not trace.content:
	raise HTTPException(status_code=400, detail=f"Trace {trace_id} has no content")

	# Generate or regenerate context documents
	from backend.services.universal_parser_service import regenerate_context_documents
	created_docs = regenerate_context_documents(trace_id, trace.content, db, force=force)

	return {
	"status": "success",
	"message": f"{'Regenerated' if force else 'Generated'} {len(created_docs)} context documents",
	"trace_id": trace_id,
	"context_documents_generated": len(created_docs),
	"force_regenerate": force,
	"documents": [{"title": doc.get("title"), "type": doc.get("document_type")} for doc in created_docs]
	}

	except HTTPException:
	raise
	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error auto-generating context documents for trace {trace_id}: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while auto-generating context documents")

	@router.get("/{trace_id}/enhanced-statistics")
	async def get_enhanced_trace_statistics(trace_id: str, db: Session = Depends(get_db)):
	"""
	Get enhanced trace statistics including cost information and detailed token analytics.

	Args:
	trace_id: The ID of the trace
	db: Database session

	Returns:
	Enhanced statistics with cost calculations
	"""
	trace = get_trace(db, trace_id)
	if not trace:
	raise HTTPException(status_code=404, detail=f"Trace with ID {trace_id} not found")

	try:
	# Get basic trace information
	basic_stats = {
	"trace_id": trace.trace_id,
	"character_count": trace.character_count or 0,
	"turn_count": trace.turn_count or 0,
	"upload_timestamp": trace.upload_timestamp.isoformat() if trace.upload_timestamp else None,
	"trace_type": trace.trace_type,
	}

	# Get schema analytics if available
	schema_analytics = None
	if trace.trace_metadata and trace.trace_metadata.get("schema_analytics"):
	schema_analytics = trace.trace_metadata["schema_analytics"]

	enhanced_stats = {"basic": basic_stats}

	if schema_analytics:
	# Get token analytics
	token_analytics = schema_analytics.get("numerical_overview", {}).get("token_analytics", {})
	prompt_analytics = schema_analytics.get("prompt_analytics", {})

	# Calculate cost information
	cost_info = cost_service.calculate_trace_costs(schema_analytics)

	# Enhanced token statistics
	enhanced_stats["tokens"] = {
	"total_tokens": token_analytics.get("total_tokens", 0),
	"total_prompt_tokens": token_analytics.get("total_prompt_tokens", 0),
	"total_completion_tokens": token_analytics.get("total_completion_tokens", 0),
	"avg_tokens_per_component": token_analytics.get("avg_tokens_per_component", 0),
	"prompt_to_completion_ratio": token_analytics.get("prompt_to_completion_ratio", 0),
	}

	# Enhanced prompt call statistics
	enhanced_stats["prompt_calls"] = {
	"total_calls": prompt_analytics.get("prompt_calls_detected", 0),
	"successful_calls": prompt_analytics.get("successful_calls", 0),
	"failed_calls": prompt_analytics.get("failed_calls", 0),
	"avg_prompt_tokens_per_call": cost_info.get("avg_prompt_tokens_per_call", 0),
	"avg_completion_tokens_per_call": cost_info.get("avg_completion_tokens_per_call", 0),
	}

	# Cost information
	enhanced_stats["cost"] = {
	"total_cost_usd": cost_info.get("total_cost_usd", 0.0),
	"input_cost_usd": cost_info.get("input_cost_usd", 0.0),
	"output_cost_usd": cost_info.get("output_cost_usd", 0.0),
	"avg_cost_per_call_usd": cost_info.get("avg_cost_per_call_usd", 0.0),
	"model_used": cost_info.get("model_used", "gpt-5-mini"),
	"pricing_source": cost_info.get("pricing_source", "fallback"),
	"cost_efficiency_tokens_per_dollar": cost_info.get("cost_efficiency_tokens_per_dollar", 0),
	"model_metadata": cost_info.get("model_metadata"),
	}

	# Performance analytics
	timing_analytics = schema_analytics.get("numerical_overview", {}).get("timing_analytics", {})
	enhanced_stats["performance"] = {
	"total_execution_time_ms": timing_analytics.get("total_execution_time_ms", 0),
	"total_execution_time_seconds": timing_analytics.get("total_execution_time_seconds", 0),
	"avg_execution_time_ms": timing_analytics.get("avg_execution_time_ms", 0),
	"max_execution_time_ms": timing_analytics.get("max_execution_time_ms", 0),
	"min_execution_time_ms": timing_analytics.get("min_execution_time_ms", 0),
	}

	# Component statistics
	component_stats = schema_analytics.get("numerical_overview", {}).get("component_stats", {})
	enhanced_stats["components"] = {
	"total_components": component_stats.get("total_components", 0),
	"unique_component_types": component_stats.get("unique_component_types", 0),
	"max_depth": component_stats.get("max_depth", 0),
	"success_rate": component_stats.get("success_rate", 0),
	"error_components": component_stats.get("error_components", 0),
	}

	else:
	# Provide basic fallback statistics when schema analytics is not available
	enhanced_stats.update({
	"tokens": {
	"total_tokens": 0,
	"total_prompt_tokens": 0,
	"total_completion_tokens": 0,
	"avg_tokens_per_component": 0,
	"prompt_to_completion_ratio": 0,
	},
	"prompt_calls": {
	"total_calls": 0,
	"successful_calls": 0,
	"failed_calls": 0,
	"avg_prompt_tokens_per_call": 0,
	"avg_completion_tokens_per_call": 0,
	},
	"cost": {
	"total_cost_usd": 0.0,
	"input_cost_usd": 0.0,
	"output_cost_usd": 0.0,
	"avg_cost_per_call_usd": 0.0,
	"model_used": "unknown",
	"pricing_source": "unavailable",
	"cost_efficiency_tokens_per_dollar": 0,
	},
	"performance": {
	"total_execution_time_ms": 0,
	"total_execution_time_seconds": 0,
	"avg_execution_time_ms": 0,
	"max_execution_time_ms": 0,
	"min_execution_time_ms": 0,
	},
	"components": {
	"total_components": 0,
	"unique_component_types": 0,
	"max_depth": 0,
	"success_rate": 0,
	"error_components": 0,
	}
	})

	return {
	"status": "success",
	"enhanced_statistics": enhanced_stats,
	"has_schema_analytics": schema_analytics is not None
	}

	except Exception as e:
	logger = logging.getLogger("agent_monitoring_server")
	logger.error(f"Error generating enhanced statistics for trace {trace_id}: {str(e)}")
	raise HTTPException(status_code=500, detail="An internal error occurred while generating enhanced statistics")

	class ChunkingConfig(BaseModel):
	min_chunk_size: Optional[int] = None
	max_chunk_size: Optional[int] = None

	class ProcessTraceRequest(BaseModel):
	splitter_type: str = "agent_semantic"
	force_regenerate: bool = True
	method_name: str = "production"
	model: str = "gpt-5-mini"
	chunking_config: Optional[ChunkingConfig] = None

	@router.post("/{trace_id}/process")
	async def process_trace(
	trace_id: str,
	background_tasks: BackgroundTasks,
	request: ProcessTraceRequest,
	session: Session = Depends(get_db)
	):
	"""
	Process a trace to create a knowledge graph using sliding window analysis.
	"""
	splitter_type = request.splitter_type
	force_regenerate = request.force_regenerate
	method_name = request.method_name
	model = request.model
	chunking_config = request.chunking_config

	logger.info(f"Processing trace {trace_id} with splitter_type={splitter_type}, force_regenerate={force_regenerate}, method_name={method_name}, model={model}, chunking_config={chunking_config}")

	valid_splitters = ["agent_semantic", "json", "prompt_interaction"]
	if splitter_type not in valid_splitters:
	raise HTTPException(
	status_code=400,
	detail=f"Invalid splitter_type '{splitter_type}'. Must be one of: {', '.join(valid_splitters)}"
	)

	from agentgraph.shared.method_registry import is_valid_method, get_method_names
	if not is_valid_method(method_name):
	available_methods = get_method_names()
	raise HTTPException(
	status_code=400,
	detail=f"Invalid method_name '{method_name}'. Must be one of: {', '.join(available_methods)}"
	)

	task_id = f"process_trace_{trace_id}_{int(time.time())}"

	try:
	task_message = f"Processing trace {trace_id} with {splitter_type} splitter, {method_name} method, and {model} model"
	if force_regenerate:
	task_message += " (force regenerate enabled)"
	create_task(task_id, "process_trace", task_message)

	background_tasks.add_task(process_trace_task, trace_id, session, task_id, splitter_type, force_regenerate, method_name, model, chunking_config)

	return {
	"status": "success",
	"task_id": task_id,
	"splitter_type": splitter_type,
	"force_regenerate": force_regenerate,
	"method_name": method_name,
	"model": model,
	"message": f"Started processing trace {trace_id} with {splitter_type} splitter, {method_name} method, and {model} model" +
	(" (force regenerate enabled)" if force_regenerate else "")
	}
	except Exception as e:
	logger.error(f"Error starting trace processing task: {e}")
	raise HTTPException(
	status_code=500,
	detail="An internal error occurred while starting trace processing"
	)