Spaces:

darkfire514
/

OpenSpace

Running

App Files Files Community

OpenSpace / openspace /config /grounding.py

darkfire514

Upload 160 files

399b80c verified about 2 months ago

raw

history blame contribute delete

11.9 kB

	from typing import Dict, Optional, Any, List, Literal
	try:
	from pydantic import BaseModel, Field, field_validator
	PYDANTIC_V2 = True
	except ImportError:
	from pydantic import BaseModel, Field, validator as field_validator
	PYDANTIC_V2 = False

	from openspace.grounding.core.types import (
	SessionConfig,
	SecurityPolicy,
	BackendType
	)
	from .constants import LOG_LEVELS


	class ConfigMixin:
	"""Mixin to add utility methods for config access"""

	def get_value(self, key: str, default=None):
	"""
	Safely get config value, works with both dict and Pydantic models.

	Args:
	key: Configuration key
	default: Default value if key not found
	"""
	if isinstance(self, dict):
	return self.get(key, default)
	else:
	return getattr(self, key, default)


	class BackendConfig(BaseModel, ConfigMixin):
	"""Base backend configuration"""
	enabled: bool = Field(True, description="Whether the backend is enabled")
	timeout: int = Field(30, ge=1, le=300, description="Timeout in seconds")
	max_retries: int = Field(3, ge=0, le=10, description="Maximum retry attempts")


	class ShellConfig(BackendConfig):
	"""
	Shell backend configuration

	Attributes:
	enabled: Whether shell backend is enabled
	mode: Execution mode - "local" runs scripts in-process via subprocess,
	"server" connects to a running local_server via HTTP
	timeout: Default timeout for shell operations (seconds)
	max_retries: Maximum number of retry attempts for failed operations
	retry_interval: Wait time between retries (seconds)
	default_shell: Path to default shell executable
	working_dir: Default working directory for bash scripts
	env: Default environment variables for shell operations
	conda_env: Conda environment name to activate before execution (optional)
	default_port: Default port for shell server connection (only used in server mode)
	"""
	mode: Literal["local", "server"] = Field("local", description="Execution mode: 'local' (in-process subprocess) or 'server' (HTTP local_server)")
	retry_interval: float = Field(3.0, ge=0.1, le=60.0, description="Wait time between retries in seconds")
	default_shell: str = Field("/bin/bash", description="Default shell path")
	working_dir: Optional[str] = Field(None, description="Default working directory for bash scripts")
	env: Dict[str, str] = Field(default_factory=dict, description="Default environment variables")
	conda_env: Optional[str] = Field(None, description="Conda environment name to activate (e.g., 'myenv')")
	default_port: int = Field(5000, ge=1, le=65535, description="Default port for shell server")
	use_clawwork_productivity: bool = Field(
	False,
	description="If True and livebench is installed, add ClawWork productivity tools (search_web, read_webpage, create_file, read_file, execute_code_sandbox, create_video) for fair comparison with ClawWork."
	)
	productivity_date: str = Field(
	"default",
	description="Date segment for productivity sandbox paths (e.g. 'default' or 'YYYY-MM-DD'). Used when use_clawwork_productivity is True."
	)

	@field_validator('default_shell')
	@classmethod
	def validate_shell(cls, v):
	if not v or not isinstance(v, str):
	raise ValueError("Shell path must be a non-empty string")
	return v

	@field_validator('working_dir')
	@classmethod
	def validate_working_dir(cls, v):
	if v is not None and not isinstance(v, str):
	raise ValueError("Working directory must be a string")
	return v

	class WebConfig(BackendConfig):
	"""
	Web backend configuration - AI Deep Research

	Attributes:
	enabled: Whether web backend is enabled
	timeout: Default timeout for web operations (seconds)
	max_retries: Maximum number of retry attempts

	Note:
	All web-specific parameters (API key, base URL) are loaded from
	environment variables or use default values in WebSession:
	- OPENROUTER_API_KEY: API key for deep research (required)
	- Deep research base URL defaults to "https://openrouter.ai/api/v1"
	"""
	pass


	class MCPConfig(BackendConfig):
	"""MCP backend configuration"""
	sandbox: bool = Field(False, description="Whether to enable sandbox")
	auto_initialize: bool = Field(True, description="Whether to auto initialize")
	eager_sessions: bool = Field(False, description="Whether to eagerly create sessions for all servers on initialization")
	retry_interval: float = Field(2.0, ge=0.1, le=60.0, description="Wait time between retries in seconds")
	servers: Dict[str, Dict[str, Any]] = Field(default_factory=dict, description="MCP servers configuration, loaded from config_mcp.json")
	sse_read_timeout: float = Field(300.0, ge=1.0, le=3600.0, description="SSE read timeout in seconds for HTTP/Sandbox connectors")


	class GUIConfig(BackendConfig):
	"""
	GUI backend configuration

	Attributes:
	mode: Execution mode - "local" runs GUI operations in-process,
	"server" connects to a running local_server via HTTP
	"""
	mode: Literal["local", "server"] = Field("local", description="Execution mode: 'local' (in-process) or 'server' (HTTP local_server)")
	retry_interval: float = Field(5.0, ge=0.1, le=60.0, description="Wait time between retries in seconds")
	driver_type: str = Field("pyautogui", description="GUI driver type")
	failsafe: bool = Field(False, description="Whether to enable pyautogui failsafe mode")
	screenshot_on_error: bool = Field(True, description="Whether to capture screenshot on error")
	pkgs_prefix: str = Field(
	"import pyautogui; import time; pyautogui.FAILSAFE = {failsafe}; {command}",
	description="Python command prefix for pyautogui setup"
	)


	class ToolSearchConfig(BaseModel):
	"""Tool search and ranking configuration"""
	embedding_model: str = Field(
	"BAAI/bge-small-en-v1.5",
	description="Embedding model name for semantic search"
	)
	max_tools: int = Field(
	20,
	ge=1,
	le=1000,
	description="Maximum number of tools to return from search"
	)
	search_mode: str = Field(
	"hybrid",
	description="Default search mode: semantic, keyword, or hybrid"
	)
	enable_llm_filter: bool = Field(
	True,
	description="Whether to use LLM for backend/server filtering"
	)
	llm_filter_threshold: int = Field(
	50,
	ge=1,
	le=1000,
	description="Only apply LLM filter when tool count exceeds this threshold"
	)
	enable_cache_persistence: bool = Field(
	False,
	description="Whether to persist embeddings to disk"
	)
	cache_dir: Optional[str] = Field(
	None,
	description="Directory for embedding cache. None means use default <project_root>/.openspace/embedding_cache"
	)

	@field_validator('search_mode')
	@classmethod
	def validate_search_mode(cls, v):
	valid_modes = ['semantic', 'keyword', 'hybrid']
	if v.lower() not in valid_modes:
	raise ValueError(f"Search mode must be one of {valid_modes}, got: {v}")
	return v.lower()


	class ToolQualityConfig(BaseModel):
	"""Tool quality tracking configuration"""
	enabled: bool = Field(
	True,
	description="Whether to enable tool quality tracking"
	)
	enable_persistence: bool = Field(
	True,
	description="Whether to persist quality data to disk"
	)
	cache_dir: Optional[str] = Field(
	None,
	description="Directory for quality cache. None means use default <project_root>/.openspace/tool_quality"
	)
	auto_evaluate_descriptions: bool = Field(
	True,
	description="Whether to automatically evaluate tool descriptions using LLM"
	)
	enable_quality_ranking: bool = Field(
	True,
	description="Whether to incorporate quality scores in tool ranking"
	)
	evolve_interval: int = Field(
	5,
	ge=1,
	le=100,
	description="Trigger quality evolution every N tool executions"
	)


	class SkillConfig(BaseModel):
	"""Skill engine configuration

	Controls how skills are discovered, selected and injected.
	Built-in skills (``openspace/skills/``) are always auto-discovered.
	"""
	enabled: bool = Field(True, description="Enable skill matching and injection")
	skill_dirs: List[str] = Field(
	default_factory=list,
	description="Extra skill directories. Built-in openspace/skills/ is always included."
	)
	max_select: int = Field(
	2, ge=1, le=20,
	description="Maximum number of skills to inject per task"
	)


	class GroundingConfig(BaseModel):
	"""
	Main configuration for Grounding module.

	Contains configuration for all grounding backends and grounding-level settings.
	Note: Local server connection uses defaults or environment variables (LOCAL_SERVER_URL).
	"""
	# Backend configurations
	shell: ShellConfig = Field(default_factory=ShellConfig)
	web: WebConfig = Field(default_factory=WebConfig)
	mcp: MCPConfig = Field(default_factory=MCPConfig)
	gui: GUIConfig = Field(default_factory=GUIConfig)
	system: BackendConfig = Field(default_factory=BackendConfig)

	# Grounding-level settings
	tool_search: ToolSearchConfig = Field(default_factory=ToolSearchConfig)
	tool_quality: ToolQualityConfig = Field(default_factory=ToolQualityConfig)
	skills: SkillConfig = Field(default_factory=SkillConfig)

	enabled_backends: List[Dict[str, str]] = Field(
	default_factory=list,
	description="List of enabled backends, each item: {'name': str, 'provider_cls': str}"
	)

	session_defaults: SessionConfig = Field(
	default_factory=lambda: SessionConfig(
	session_name="",
	backend_type=BackendType.SHELL,
	timeout=30,
	auto_reconnect=True,
	health_check_interval=30
	)
	)

	tool_cache_ttl: int = Field(
	300,
	ge=1,
	le=3600,
	description="Tool cache time-to-live in seconds"
	)
	tool_cache_maxsize: int = Field(
	300,
	ge=1,
	le=10000,
	description="Maximum number of tool cache entries"
	)

	debug: bool = Field(False, description="Debug mode")
	log_level: str = Field("INFO", description="Log level")
	security_policies: Dict[str, Any] = Field(default_factory=dict)

	@field_validator('log_level')
	@classmethod
	def validate_log_level(cls, v):
	if v.upper() not in LOG_LEVELS:
	raise ValueError(f"Log level must be one of {LOG_LEVELS}, got: {v}")
	return v.upper()

	def get_backend_config(self, backend_type: str) -> BackendConfig:
	"""Get configuration for specified backend"""
	name = backend_type.lower()
	if not hasattr(self, name):
	from openspace.utils.logging import Logger
	logger = Logger.get_logger(__name__)
	logger.warning(f"Unknown backend type: {backend_type}")
	return BackendConfig()
	return getattr(self, name)

	def get_security_policy(self, backend_type: str) -> SecurityPolicy:
	global_policy = self.security_policies.get("global", {})
	backend_policy = self.security_policies.get("backend", {}).get(backend_type.lower(), {})
	merged_policy = {global_policy, backend_policy}
	return SecurityPolicy.from_dict(merged_policy)


	__all__ = [
	"BackendConfig",
	"ShellConfig",
	"WebConfig",
	"MCPConfig",
	"GUIConfig",
	"ToolSearchConfig",
	"ToolQualityConfig",
	"SkillConfig",
	"GroundingConfig",
	]