Spaces:

riazmo
/

Design-System-Extractor-2

Running

App Files Files Community

Design-System-Extractor-2 / agents /graph.py

riazmo

Upload 20 files

9f5ee50 verified 4 days ago

raw

history blame contribute delete

17.9 kB

	"""
	LangGraph Workflow Orchestration
	Design System Extractor v2

	Defines the main workflow graph with agents, checkpoints, and transitions.
	"""

	from typing import Literal
	from datetime import datetime
	from langgraph.graph import StateGraph, END
	from langgraph.checkpoint.memory import MemorySaver

	from agents.state import AgentState, create_initial_state, get_stage_progress
	from core.token_schema import Viewport


	# =============================================================================
	# NODE FUNCTIONS (Agent Entry Points)
	# =============================================================================

	async def discover_pages(state: AgentState) -> AgentState:
	"""
	Agent 1 - Part 1: Discover pages from base URL.

	This node:
	1. Takes the base URL
	2. Crawls to find linked pages
	3. Classifies page types (homepage, listing, detail, etc.)
	4. Returns discovered pages for user confirmation
	"""
	from agents.crawler import PageDiscoverer

	state["current_stage"] = "discover"
	state["stage_started_at"] = datetime.now()

	try:
	discoverer = PageDiscoverer()
	pages = await discoverer.discover(state["base_url"])

	state["discovered_pages"] = pages
	state["awaiting_human_input"] = True
	state["checkpoint_name"] = "confirm_pages"

	except Exception as e:
	state["errors"].append(f"Discovery failed: {str(e)}")

	return state


	async def extract_tokens_desktop(state: AgentState) -> AgentState:
	"""
	Agent 1 - Part 2a: Extract tokens from desktop viewport.
	"""
	from agents.extractor import TokenExtractor

	state["current_stage"] = "extract"

	try:
	extractor = TokenExtractor(viewport=Viewport.DESKTOP)
	result = await extractor.extract(
	pages=state["pages_to_crawl"],
	progress_callback=lambda p: state.update({"desktop_crawl_progress": p})
	)

	state["desktop_extraction"] = result

	except Exception as e:
	state["errors"].append(f"Desktop extraction failed: {str(e)}")

	return state


	async def extract_tokens_mobile(state: AgentState) -> AgentState:
	"""
	Agent 1 - Part 2b: Extract tokens from mobile viewport.
	"""
	from agents.extractor import TokenExtractor

	try:
	extractor = TokenExtractor(viewport=Viewport.MOBILE)
	result = await extractor.extract(
	pages=state["pages_to_crawl"],
	progress_callback=lambda p: state.update({"mobile_crawl_progress": p})
	)

	state["mobile_extraction"] = result

	except Exception as e:
	state["errors"].append(f"Mobile extraction failed: {str(e)}")

	return state


	async def normalize_tokens(state: AgentState) -> AgentState:
	"""
	Agent 2: Normalize and structure extracted tokens.
	"""
	from agents.normalizer import TokenNormalizer

	state["current_stage"] = "normalize"
	state["stage_started_at"] = datetime.now()

	try:
	normalizer = TokenNormalizer()

	if state["desktop_extraction"]:
	state["desktop_normalized"] = normalizer.normalize(state["desktop_extraction"])

	if state["mobile_extraction"]:
	state["mobile_normalized"] = normalizer.normalize(state["mobile_extraction"])

	# After normalization, wait for human review
	state["awaiting_human_input"] = True
	state["checkpoint_name"] = "review_tokens"

	except Exception as e:
	state["errors"].append(f"Normalization failed: {str(e)}")

	return state


	async def generate_recommendations(state: AgentState) -> AgentState:
	"""
	Agent 3: Generate upgrade recommendations.
	"""
	from agents.advisor import DesignSystemAdvisor

	state["current_stage"] = "advise"
	state["stage_started_at"] = datetime.now()

	try:
	advisor = DesignSystemAdvisor()
	recommendations = await advisor.analyze_and_recommend(
	desktop=state["desktop_normalized"],
	mobile=state["mobile_normalized"],
	)

	state["upgrade_recommendations"] = recommendations

	# Wait for human to select upgrades
	state["awaiting_human_input"] = True
	state["checkpoint_name"] = "select_upgrades"

	except Exception as e:
	state["errors"].append(f"Recommendation generation failed: {str(e)}")

	return state


	async def generate_final_tokens(state: AgentState) -> AgentState:
	"""
	Agent 4: Generate final token JSON.
	"""
	from agents.generator import TokenGenerator

	state["current_stage"] = "generate"
	state["stage_started_at"] = datetime.now()

	try:
	generator = TokenGenerator()

	# Build selection config from user choices
	selections = {
	"type_scale": state["selected_type_scale"],
	"spacing_system": state["selected_spacing_system"],
	"naming_convention": state["selected_naming_convention"],
	"color_ramps": state["selected_color_ramps"],
	"a11y_fixes": state["selected_a11y_fixes"],
	}

	if state["desktop_normalized"]:
	state["desktop_final"] = generator.generate(
	normalized=state["desktop_normalized"],
	selections=selections,
	version=state["version_label"],
	)

	if state["mobile_normalized"]:
	state["mobile_final"] = generator.generate(
	normalized=state["mobile_normalized"],
	selections=selections,
	version=state["version_label"],
	)

	# Wait for human to approve export
	state["awaiting_human_input"] = True
	state["checkpoint_name"] = "approve_export"

	except Exception as e:
	state["errors"].append(f"Token generation failed: {str(e)}")

	return state


	async def complete_workflow(state: AgentState) -> AgentState:
	"""
	Final node: Mark workflow as complete.
	"""
	state["current_stage"] = "export"
	state["awaiting_human_input"] = False
	state["checkpoint_name"] = None

	return state


	# =============================================================================
	# HUMAN CHECKPOINT HANDLERS
	# =============================================================================

	def handle_page_confirmation(state: AgentState, confirmed_pages: list[str]) -> AgentState:
	"""Handle human confirmation of pages to crawl."""
	state["pages_to_crawl"] = confirmed_pages
	state["awaiting_human_input"] = False
	state["checkpoint_name"] = None
	return state


	def handle_token_review(
	state: AgentState,
	color_decisions: dict[str, bool],
	typography_decisions: dict[str, bool],
	spacing_decisions: dict[str, bool],
	) -> AgentState:
	"""Handle human review of extracted tokens."""
	state["accepted_colors"] = [k for k, v in color_decisions.items() if v]
	state["rejected_colors"] = [k for k, v in color_decisions.items() if not v]
	state["accepted_typography"] = [k for k, v in typography_decisions.items() if v]
	state["rejected_typography"] = [k for k, v in typography_decisions.items() if not v]
	state["accepted_spacing"] = [k for k, v in spacing_decisions.items() if v]
	state["rejected_spacing"] = [k for k, v in spacing_decisions.items() if not v]

	state["awaiting_human_input"] = False
	state["checkpoint_name"] = None
	return state


	def handle_upgrade_selection(
	state: AgentState,
	type_scale: str \| None,
	spacing_system: str \| None,
	naming_convention: str \| None,
	color_ramps: dict[str, bool],
	a11y_fixes: list[str],
	) -> AgentState:
	"""Handle human selection of upgrade options."""
	state["selected_type_scale"] = type_scale
	state["selected_spacing_system"] = spacing_system
	state["selected_naming_convention"] = naming_convention
	state["selected_color_ramps"] = color_ramps
	state["selected_a11y_fixes"] = a11y_fixes

	state["awaiting_human_input"] = False
	state["checkpoint_name"] = None
	return state


	def handle_export_approval(state: AgentState, version_label: str) -> AgentState:
	"""Handle human approval of final export."""
	state["version_label"] = version_label
	state["awaiting_human_input"] = False
	state["checkpoint_name"] = None
	return state


	# =============================================================================
	# ROUTING FUNCTIONS
	# =============================================================================

	def route_after_discovery(state: AgentState) -> Literal["wait_for_pages", "extract"]:
	"""Route after discovery: wait for human or continue."""
	if state["awaiting_human_input"]:
	return "wait_for_pages"
	return "extract"


	def route_after_extraction(state: AgentState) -> Literal["normalize", "error"]:
	"""Route after extraction: normalize or handle error."""
	if state["desktop_extraction"] is None and state["mobile_extraction"] is None:
	return "error"
	return "normalize"


	def route_after_normalization(state: AgentState) -> Literal["wait_for_review", "advise"]:
	"""Route after normalization: wait for review or continue."""
	if state["awaiting_human_input"]:
	return "wait_for_review"
	return "advise"


	def route_after_recommendations(state: AgentState) -> Literal["wait_for_selection", "generate"]:
	"""Route after recommendations: wait for selection or continue."""
	if state["awaiting_human_input"]:
	return "wait_for_selection"
	return "generate"


	def route_after_generation(state: AgentState) -> Literal["wait_for_approval", "complete"]:
	"""Route after generation: wait for approval or complete."""
	if state["awaiting_human_input"]:
	return "wait_for_approval"
	return "complete"


	# =============================================================================
	# GRAPH BUILDER
	# =============================================================================

	def build_workflow_graph() -> StateGraph:
	"""
	Build the main LangGraph workflow.

	Flow:
	1. discover_pages -> [human confirms pages]
	2. extract_desktop + extract_mobile (parallel)
	3. normalize_tokens -> [human reviews tokens]
	4. generate_recommendations -> [human selects upgrades]
	5. generate_final_tokens -> [human approves export]
	6. complete
	"""

	# Create the graph
	workflow = StateGraph(AgentState)

	# -------------------------------------------------------------------------
	# ADD NODES
	# -------------------------------------------------------------------------

	# Discovery
	workflow.add_node("discover", discover_pages)

	# Extraction (will be parallel in subgraph)
	workflow.add_node("extract_desktop", extract_tokens_desktop)
	workflow.add_node("extract_mobile", extract_tokens_mobile)

	# Normalization
	workflow.add_node("normalize", normalize_tokens)

	# Advisor
	workflow.add_node("advise", generate_recommendations)

	# Generator
	workflow.add_node("generate", generate_final_tokens)

	# Completion
	workflow.add_node("complete", complete_workflow)

	# Human checkpoint placeholder nodes (these just pass through)
	workflow.add_node("wait_for_pages", lambda s: s)
	workflow.add_node("wait_for_review", lambda s: s)
	workflow.add_node("wait_for_selection", lambda s: s)
	workflow.add_node("wait_for_approval", lambda s: s)

	# -------------------------------------------------------------------------
	# ADD EDGES
	# -------------------------------------------------------------------------

	# Entry point
	workflow.set_entry_point("discover")

	# Discovery -> (wait or extract)
	workflow.add_conditional_edges(
	"discover",
	route_after_discovery,
	{
	"wait_for_pages": "wait_for_pages",
	"extract": "extract_desktop",
	}
	)

	# After human confirms pages -> extract
	workflow.add_edge("wait_for_pages", "extract_desktop")

	# Parallel extraction
	workflow.add_edge("extract_desktop", "extract_mobile")

	# After extraction -> normalize
	workflow.add_conditional_edges(
	"extract_mobile",
	route_after_extraction,
	{
	"normalize": "normalize",
	"error": END,
	}
	)

	# Normalization -> (wait or advise)
	workflow.add_conditional_edges(
	"normalize",
	route_after_normalization,
	{
	"wait_for_review": "wait_for_review",
	"advise": "advise",
	}
	)

	# After human reviews -> advise
	workflow.add_edge("wait_for_review", "advise")

	# Advisor -> (wait or generate)
	workflow.add_conditional_edges(
	"advise",
	route_after_recommendations,
	{
	"wait_for_selection": "wait_for_selection",
	"generate": "generate",
	}
	)

	# After human selects upgrades -> generate
	workflow.add_edge("wait_for_selection", "generate")

	# Generation -> (wait or complete)
	workflow.add_conditional_edges(
	"generate",
	route_after_generation,
	{
	"wait_for_approval": "wait_for_approval",
	"complete": "complete",
	}
	)

	# After human approves -> complete
	workflow.add_edge("wait_for_approval", "complete")

	# Complete -> END
	workflow.add_edge("complete", END)

	return workflow


	# =============================================================================
	# WORKFLOW RUNNER
	# =============================================================================

	class WorkflowRunner:
	"""
	Manages workflow execution with human-in-the-loop support.
	"""

	def __init__(self):
	self.graph = build_workflow_graph()
	self.checkpointer = MemorySaver()
	self.app = self.graph.compile(checkpointer=self.checkpointer)
	self.current_state: AgentState \| None = None
	self.thread_id: str \| None = None

	async def start(self, base_url: str, thread_id: str \| None = None) -> AgentState:
	"""Start a new workflow."""
	self.thread_id = thread_id or f"workflow_{datetime.now().timestamp()}"
	self.current_state = create_initial_state(base_url)

	config = {"configurable": {"thread_id": self.thread_id}}

	# Run until first human checkpoint
	async for event in self.app.astream(self.current_state, config):
	self.current_state = event
	if self.current_state.get("awaiting_human_input"):
	break

	return self.current_state

	async def resume(self, human_input: dict) -> AgentState:
	"""Resume workflow after human input."""
	if not self.current_state or not self.thread_id:
	raise ValueError("No active workflow to resume")

	checkpoint = self.current_state.get("checkpoint_name")

	# Apply human input based on checkpoint
	if checkpoint == "confirm_pages":
	self.current_state = handle_page_confirmation(
	self.current_state,
	human_input.get("confirmed_pages", [])
	)
	elif checkpoint == "review_tokens":
	self.current_state = handle_token_review(
	self.current_state,
	human_input.get("color_decisions", {}),
	human_input.get("typography_decisions", {}),
	human_input.get("spacing_decisions", {}),
	)
	elif checkpoint == "select_upgrades":
	self.current_state = handle_upgrade_selection(
	self.current_state,
	human_input.get("type_scale"),
	human_input.get("spacing_system"),
	human_input.get("naming_convention"),
	human_input.get("color_ramps", {}),
	human_input.get("a11y_fixes", []),
	)
	elif checkpoint == "approve_export":
	self.current_state = handle_export_approval(
	self.current_state,
	human_input.get("version_label", "v1")
	)

	config = {"configurable": {"thread_id": self.thread_id}}

	# Continue until next checkpoint or completion
	async for event in self.app.astream(self.current_state, config):
	self.current_state = event
	if self.current_state.get("awaiting_human_input"):
	break

	return self.current_state

	def get_progress(self) -> dict:
	"""Get current workflow progress."""
	if not self.current_state:
	return {"status": "not_started"}
	return get_stage_progress(self.current_state)

	def get_state(self) -> AgentState \| None:
	"""Get current state."""
	return self.current_state


	# =============================================================================
	# CONVENIENCE FUNCTIONS
	# =============================================================================

	def create_workflow() -> WorkflowRunner:
	"""Create a new workflow runner instance."""
	return WorkflowRunner()


	async def run_discovery_only(base_url: str) -> list:
	"""Run only the discovery phase (for testing)."""
	from agents.crawler import PageDiscoverer

	discoverer = PageDiscoverer()
	return await discoverer.discover(base_url)


	async def run_extraction_only(pages: list[str], viewport: Viewport) -> dict:
	"""Run only the extraction phase (for testing)."""
	from agents.extractor import TokenExtractor

	extractor = TokenExtractor(viewport=viewport)
	return await extractor.extract(pages)