Spaces:

Cyberlgl
/

CyberLegalAIendpoint

Running

File size: 17,966 Bytes

6853143
 
de9078a
6853143
 
e13ea3d
6853143
de9078a
65eb048
6853143
 
 
 
ed3da7d
 
 
a30ccf8
bd87ed7
 
 
 
ed3da7d
6853143
 
 
 
 
e13ea3d
6853143
ed3da7d
6853143
 
 
 
e13ea3d
 
ed3da7d
 
6853143
e13ea3d
 
ed3da7d
 
 
47fa0a5
65eb048
 
ed3da7d
6853143
 
 
 
 
 
 
518d129
6853143
e13ea3d
 
518d129
6853143
 
 
e13ea3d
102353e
 
 
 
e13ea3d
102353e
 
6853143
 
 
 
 
 
 
 
e13ea3d
6853143
 
e13ea3d
 
 
 
 
a30ccf8
 
e13ea3d
a30ccf8
 
e13ea3d
a30ccf8
6853143
 
e13ea3d
6853143
a30ccf8
 
e13ea3d
 
 
 
6853143
 
 
 
e13ea3d
6853143
 
 
 
 
a30ccf8
6853143
 
de9078a
6853143
e13ea3d
6853143
 
a30ccf8
6853143
a30ccf8
6853143
 
 
 
bd87ed7
6853143
a30ccf8
6853143
 
bd87ed7
e13ea3d
 
a8cf49b
 
 
e13ea3d
bd87ed7
6853143
bd87ed7
 
 
 
 
 
 
 
 
 
 
 
 
 
e13ea3d
6853143
 
 
102353e
6853143
 
 
 
a30ccf8
6853143
 
 
 
 
 
211e181
 
 
 
 
a30ccf8
6853143
0403fed
 
de9078a
e13ea3d
 
 
 
 
 
db65cdc
 
e13ea3d
 
 
 
 
102353e
e13ea3d
 
6853143
e13ea3d
 
 
65eb048
e13ea3d
 
 
 
 
 
 
 
 
 
0403fed
e13ea3d
 
 
 
 
 
 
 
6853143
 
 
 
518d129
 
e13ea3d
518d129
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e13ea3d
 
518d129
 
 
6853143
 
 
 
a8cf49b
6853143
 
65eb048
 
 
6853143
 
 
 
 
de9078a
6853143
a8cf49b
6853143
 
 
65eb048
 
6853143
 
e13ea3d
6853143
de9078a
e13ea3d
de9078a
e13ea3d
 
 
 
 
65eb048
e13ea3d
65eb048
e13ea3d
de9078a
 
e13ea3d
 
 
de9078a
 
 
 
e13ea3d
de9078a
6853143
 
 
a8cf49b
6853143
 
 
 
65eb048
 
 
6853143
 
e13ea3d
6853143
 
e13ea3d
6853143
 
518d129
e13ea3d
 
 
 
518d129
e13ea3d
6853143
de9078a
 
 
 
 
e13ea3d
de9078a
e13ea3d
 
 
 
 
de9078a
56aa261
e13ea3d
56aa261
62963c8
56aa261
 
518d129
 
e13ea3d
518d129
 
 
 
6853143
 
 
e13ea3d
6853143
 
 
 
 
 
518d129
 
6853143
 
 
de9078a
e13ea3d
de9078a
e13ea3d
 
 
 
 
8f63119
e13ea3d
8f63119
e13ea3d
 
 
 
8f63119
e13ea3d
 
 
 
 
 
 
8f63119
e13ea3d
6853143
e13ea3d
6853143
 
 
e13ea3d

#!/usr/bin/env python3
"""
Document Editor Agent - LangGraph agent for modifying HTML documents
Implements Cline-like iterative editing with validation
"""
import uuid
import logging
import traceback
from typing import Dict, Any, List, Optional
from langgraph.graph import StateGraph, END
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage, ToolMessage

from agent_states.doc_editor_state import DocEditorState
from utils.tools import (
    tools_for_doc_editor_facade as doc_editor_tools_facade,
    tools_for_doc_editor as doc_editor_tools
)
from prompts.doc_editor import (
    get_doc_editor_system_prompt,
    get_summary_system_prompt
)
from utils.utils_fn import push_document_update

logger = logging.getLogger(__name__)


class DocumentEditorAgent:
    """Agent for editing HTML documents using Cline-like iterative approach."""
    
    def __init__(self, llm, llm_tool_calling, tools=doc_editor_tools, tools_facade=doc_editor_tools_facade):
        """
        Initialize the document editor agent.
        
        Args:
            llm: LLM principal pour la génération du résumé final
            llm_tool_calling: LLM pour les tool calls
            tools: Liste des tools d'implémentation (avec doc_text injecté)
            tools_facade: Liste des tools façades (pour le LLM)
        """
        self.llm = llm
        self.llm_tool_calling = llm_tool_calling
        self.tools = tools
        self.tools_facade = tools_facade
        self.llm_with_tools = self.llm_tool_calling.bind_tools(self.tools_facade, tool_choice="any")
        logger.info("🔧 Tool binding configured with tool_choice='any' to force tool calls")
        logger.info(f"🤖 Using {type(llm_tool_calling).__name__} for tool calling")
        logger.info(f"📝 Using {type(llm).__name__} for summary generation")
        logger.info(f"🛠️ Tools loaded: {len(self.tools_facade)} facade, {len(self.tools)} implementation")
        self.workflow = self._build_workflow()
    
    def _build_workflow(self) -> StateGraph:
        """Build the LangGraph workflow for document editing."""
        workflow = StateGraph(DocEditorState)
        workflow.add_node("agent", self._agent_node)
        workflow.add_node("tools", self._tools_node)
        workflow.add_node("summary", self._summary_node)
        workflow.set_entry_point("agent")
        workflow.add_conditional_edges("agent", self._should_continue, {"continue": "tools", "end": END})
        workflow.add_conditional_edges("tools", self._after_tools, {"continue": "agent", "summary": "summary", "end": END})
        workflow.add_edge("summary", END)
        return workflow.compile()
    
    def _should_continue(self, state: DocEditorState) -> str:
        """Decide whether to continue after agent node."""
        iteration_count = state.get("iteration_count", 0)
        max_iterations = state.get("max_iterations", 10)
        
        if iteration_count >= max_iterations:
            logger.warning(f"Max iterations ({max_iterations}) reached - ending workflow")
            return "end"
        
        intermediate_steps = state.get("intermediate_steps", [])
        if not intermediate_steps:
            return "continue"
        
        last_message = intermediate_steps[-1]
        
        if hasattr(last_message, 'tool_calls') and last_message.tool_calls:
            tool_names = [tc['name'] for tc in last_message.tool_calls]
            logger.info(f"Agent calling tools: {tool_names}")
            return "continue"
        
        # Check if attempt_completion was ever called
        attempt_completion_called = any(
            isinstance(msg, ToolMessage) and msg.name == "attempt_completion"
            for msg in intermediate_steps
        )
        
        if attempt_completion_called:
            logger.info("attempt_completion already called - ending workflow")
            return "end"
        
        logger.warning("Agent response without tool calls - forcing continue")
        return "continue"
    
    def _after_tools(self, state: DocEditorState) -> str:
        """Decide whether to continue after tools node."""
        intermediate_steps = state.get("intermediate_steps", [])
        last_msg = intermediate_steps[-1]
        
        if isinstance(last_msg, ToolMessage) and last_msg.name == "attempt_completion":
            logger.info("attempt_completion called - generating summary")
            return "summary"
        
        iteration_count = state.get("iteration_count", 0)
        max_iterations = state.get("max_iterations", 10)
        
        if iteration_count >= max_iterations:
            logger.warning(f"Max iterations ({max_iterations}) reached - ending workflow")
            return "end"
        
        return "continue"
    
    async def _agent_node(self, state: DocEditorState) -> DocEditorState:
        """Agent node: Generate tool calls based on current state."""
        intermediate_steps = state.get("intermediate_steps", [])
        iteration_count = state.get("iteration_count", 0)
        max_iterations = state.get("max_iterations", 10)
        
        logger.info(f"Agent iteration {iteration_count + 1}/{max_iterations}")
        
        if iteration_count == 0:
            intermediate_steps.append(SystemMessage(content=get_doc_editor_system_prompt()))
            
            context_msg = ""
            conversation_history = state.get("conversation_history", [])
            doc_summaries = state.get("doc_summaries", [])
            
            if conversation_history:
                context_msg += "\n\n##Previous conversation:\n"
                for msg in conversation_history:
                    context_msg += f"{msg.get('role', '').capitalize()}: {msg.get('content', '')}\n"
            
            if doc_summaries:
                context_msg += "\n\n##Document summaries:\n" + "\n".join(f"- {s}" for s in doc_summaries)
            
            plan_formatted = f"""## EXECUTION PLAN
You have been provided with an execution plan. Follow this plan carefully to complete the task:
{state['plan']}
Use this plan as your guide for the editing steps to perform."""
            
            full_message = f"{context_msg}\n\n##Instruction\n{state['user_instruction']}\n\n{plan_formatted}"
            intermediate_steps.append(HumanMessage(content=full_message))
            
            # Add fake tool call/response after user message
            fake_tool_call_id = str(uuid.uuid4())
            intermediate_steps.append(
                AIMessage(content="", tool_calls=[{
                    "id": fake_tool_call_id,
                    "name": "view_current_document",
                    "args": {}
                }])
            )
            intermediate_steps.append(
                ToolMessage(content=state['doc_text'], tool_call_id=fake_tool_call_id, name="view_current_document")
            )
            logger.info(f"🔍 Initial document provided via fake view_current_document ({len(state['doc_text'])}b)")
            logger.info(f"Context: {len(conversation_history)} hist + {len(doc_summaries)} summaries")
        
        response = await self.llm_with_tools.ainvoke(intermediate_steps)
        intermediate_steps.append(response)
        
        state["intermediate_steps"] = intermediate_steps
        return state
    
    async def _tools_node(self, state: DocEditorState) -> DocEditorState:
        """Tools node: Execute tool calls and update document state."""
        intermediate_steps = state.get("intermediate_steps", [])
        last_message = intermediate_steps[-1]
        
        if not (hasattr(last_message, 'tool_calls') and last_message.tool_calls):
            return state
        
        # Increment iteration count after tools are executed
        iteration_count = state.get("iteration_count", 0)
        iteration_count += 1
        state["iteration_count"] = iteration_count
        
        for tool_call in last_message.tool_calls:
            tool_name = tool_call['name']
            # Look up implementation function with underscore prefix
            tool_func = next((t for t in self.tools if t.name == "_" + tool_name), None)
            
            if not tool_func:
                logger.warning(f"Tool function not found for {tool_name}")
                continue
            
            args = tool_call['args'].copy()
            
            # Inject doc_text for editing tools AND view_current_document
            if tool_name in ["replace_html", "add_html", "delete_html", "view_current_document"]:
                args["doc_text"] = state["doc_text"]
                logger.info(f"Injecting doc_text ({len(state['doc_text'])}b) into {tool_name}")
            
            try:
                result = await tool_func.ainvoke(args)
                
                if result.get("ok") and "doc_text" in result:
                    state["doc_text"] = result["doc_text"]
                    
                    if tool_name in ["replace_html", "add_html", "delete_html"]:
                        document_id = state.get("document_id")
                        user_id = state.get("user_id")
                        
                        if document_id and user_id:
                            logger.info(f"Pushing document update after successful {tool_name}...")
                            await push_document_update(
                                document_id=document_id,
                                content=state["doc_text"],
                                user_id=user_id
                            )
                        else:
                            logger.debug("No document_id/user_id, skipping update push")
                

                intermediate_steps.append(
                    ToolMessage(content=str(result), tool_call_id=tool_call['id'], name=tool_name)
                )
            except Exception as e:
                intermediate_steps.append(
                    ToolMessage(content=f"Error: {str(e)}", tool_call_id=tool_call['id'], name=tool_name)
                )
                logger.error(f"{tool_name} error: {str(e)}")
        
        state["intermediate_steps"] = intermediate_steps
        return state
    
    async def _summary_node(self, state: DocEditorState) -> DocEditorState:
        """Summary node: Generate a clean summary of all modifications."""
        logger.info("Generating modification summary...")
        
        summary_messages = [
            SystemMessage(content=get_summary_system_prompt()),
            HumanMessage(content=f"""
Original instruction: {state['user_instruction']}

Full conversation history (including all tool calls and results):
""", name="user")
        ]
        
        intermediate_steps = state.get("intermediate_steps", [])
        for msg in intermediate_steps:
            summary_messages.append(msg)
        
        response = await self.llm.ainvoke(summary_messages)
        state["final_summary"] = response.content
        
        logger.info("Summary generated successfully")
        logger.info(f"Summary preview: {response.content}...")
        
        return state
    
    async def edit_document(
        self, 
        doc_text: str, 
        user_instruction: str, 
        plan: Optional[str] = None,
        doc_summaries: List[str] = [],
        conversation_history: List[Dict[str, str]] = [],
        max_iterations: int = 10,
        document_id: Optional[str] = None,
        user_id: Optional[str] = None
    ) -> Dict[str, Any]:
        """
        Edit a document according to the user instruction.
        
        Args:
            doc_text: HTML document string
            user_instruction: What changes to make to the document
            plan: Optional execution plan provided by DocAssistant
            doc_summaries: Optional summaries of the document for context
            conversation_history: Optional previous conversation messages for context
            max_iterations: Maximum number of edit iterations (default: 10)
            document_id: Optional UUID of the document for live updates
            user_id: Optional user ID for authentication
        
        Returns:
            Dict with doc_text, message, success, iteration_count, final_summary
        """
        logger.info("=" * 80)
        logger.info("DOCUMENT EDITOR AGENT STARTING")
        logger.info("=" * 80)
        logger.info(f"Initial document size: {len(doc_text)} bytes")
        logger.info(f"Instruction: {user_instruction}{'...' if len(user_instruction) > 100 else ''}")
        logger.info(f"Document summaries: {len(doc_summaries)}")
        logger.info(f"Conversation history: {len(conversation_history)} messages")
        logger.info(f"Max iterations: {max_iterations}")
        if document_id:
            logger.info(f"Document ID: {document_id} (live updates enabled)")
        if user_id:
            logger.info(f"User ID: {user_id}")
        
        if doc_summaries:
            logger.info("Document summaries loaded:")
            for i, summary in enumerate(doc_summaries, 1):
                logger.info(f"  [{i}] {str(summary)}...")
            if len(doc_summaries) > 3:
                logger.info(f"  ... and {len(doc_summaries) - 3} more")
        
        if conversation_history:
            logger.info(f"Conversation history loaded ({len(conversation_history)} messages)")
        
        initial_state = {
            "doc_text": doc_text,
            "doc_summaries": doc_summaries,
            "plan": plan,
            "conversation_history": conversation_history,
            "user_instruction": user_instruction,
            "iteration_count": 0,
            "max_iterations": max_iterations,
            "intermediate_steps": [],
            "document_id": document_id,
            "user_id": user_id
        }
        
        logger.info("Initial state prepared, starting workflow...")
        
        try:
            logger.info("Invoking LangGraph workflow...")
            final_state = await self.workflow.ainvoke(initial_state)
            
            final_summary = final_state.get("final_summary", "")
            attempt_completion_called = any(
                isinstance(msg, ToolMessage) and msg.name == "attempt_completion"
                for msg in final_state.get("intermediate_steps", [])
            )
            success = attempt_completion_called
            message = final_summary
            
            iteration_count = final_state.get("iteration_count", 0)
            final_doc_size = len(final_state["doc_text"])
            size_change = final_doc_size - len(doc_text)
            
            logger.info("=" * 80)
            logger.info("DOCUMENT EDITING COMPLETED")
            logger.info("=" * 80)
            logger.info(f"Success: {success}")
            logger.info(f"Iterations: {iteration_count}")
            logger.info(f"Final document size: {final_doc_size} bytes")
            logger.info(f"Size change: {size_change:+d} bytes ({size_change/len(doc_text)*100:+.1f}%)")
            logger.info(f"Message: {message}{'...' if len(message) > 100 else ''}")
            
            logger.info("=" * 80)
            logger.info("FINAL DOCUMENT CONTENT")
            logger.info("=" * 80)
            logger.info(final_state["doc_text"])
            logger.info("=" * 80)
            
            if final_summary:
                logger.info("=" * 80)
                logger.info("MODIFICATION SUMMARY")
                logger.info("=" * 80)
                logger.info(final_summary)
                logger.info("=" * 80)
            
            if not success:
                max_iters = final_state.get("max_iterations", 10)
                if iteration_count >= max_iters:
                    logger.warning(f"Failed to complete editing within {max_iters} iterations")
                    message = f"Failed to complete editing within {max_iters} iterations"
            
            return {
                "doc_text": final_state["doc_text"],
                "message": message,
                "success": success,
                "iteration_count": iteration_count,
                "final_summary": final_summary
            }
        
        except Exception as e:
            logger.error("=" * 80)
            logger.error("DOCUMENT EDITING FAILED")
            logger.error("=" * 80)
            logger.error(f"Location: subagents/doc_editor.py:{traceback.extract_tb(e.__traceback__)[-1].lineno}")
            logger.error(f"Error type: {type(e).__name__}")
            logger.error(f"Error message: {str(e)}")
            logger.error(f"User Instruction: {user_instruction if len(user_instruction) > 100 else user_instruction}")
            logger.error(f"Document Size: {len(doc_text):,} bytes")
            if document_id:
                logger.error(f"Document ID: {document_id}")
            if user_id:
                logger.error(f"User ID: {user_id}")
            logger.error(f"Max Iterations: {max_iterations}")
            logger.error(f"Document Summaries: {len(doc_summaries)}")
            logger.error(f"Conversation History: {len(conversation_history)} messages")
            if plan:
                logger.error(f"Plan: {plan if len(plan) > 200 else plan}")
            logger.error(f"Main LLM: {type(self.llm).__name__}")
            logger.error(f"Tool Calling LLM: {type(self.llm_tool_calling).__name__}")
            logger.error(f"Tools Available: {len(self.tools)}")
            logger.error(f"Tool Names: {', '.join([t.name for t in self.tools])}")
            logger.error(f"Traceback:\n{traceback.format_exc()}")
            logger.error(f"Document Preview: {doc_text[:200]}")
            logger.error("=" * 80)
            
            return {
                "doc_text": doc_text,
                "message": f"Error during editing: {str(e)}",
                "success": False,
                "iteration_count": 0
            }