Spaces:

jkbennitt
/

felix-framework

Paused

felix-framework / tests /unit /test_knowledge_store.py

jkbennitt

Clean hf-space branch and prepare for HuggingFace Spaces deployment

fb867c3 5 months ago

44.8 kB

	"""
	Unit tests for Knowledge Store System.

	Tests the KnowledgeStore, KnowledgeEntry, KnowledgeQuery classes and all
	persistence, retrieval, and management functionality.
	"""

	import pytest
	import json
	import time
	import sqlite3
	import tempfile
	import os
	from pathlib import Path
	from unittest.mock import patch, MagicMock
	from src.memory.knowledge_store import (
	KnowledgeStore, KnowledgeEntry, KnowledgeQuery,
	KnowledgeType, ConfidenceLevel
	)


	class TestKnowledgeEntry:
	"""Test KnowledgeEntry data class and serialization."""

	def test_knowledge_entry_creation(self):
	"""Test basic KnowledgeEntry creation."""
	content = {"task": "blog_writing", "result": "success"}
	entry = KnowledgeEntry(
	knowledge_id="test_id_123",
	knowledge_type=KnowledgeType.TASK_RESULT,
	content=content,
	confidence_level=ConfidenceLevel.HIGH,
	source_agent="test_agent",
	domain="writing",
	tags=["blog", "success"]
	)

	assert entry.knowledge_id == "test_id_123"
	assert entry.knowledge_type == KnowledgeType.TASK_RESULT
	assert entry.content == content
	assert entry.confidence_level == ConfidenceLevel.HIGH
	assert entry.source_agent == "test_agent"
	assert entry.domain == "writing"
	assert entry.tags == ["blog", "success"]
	assert entry.access_count == 0
	assert entry.success_rate == 1.0
	assert isinstance(entry.created_at, float)
	assert isinstance(entry.updated_at, float)

	def test_knowledge_entry_defaults(self):
	"""Test KnowledgeEntry with default values."""
	entry = KnowledgeEntry(
	knowledge_id="test_123",
	knowledge_type=KnowledgeType.AGENT_INSIGHT,
	content={"insight": "useful pattern"},
	confidence_level=ConfidenceLevel.MEDIUM,
	source_agent="analyzer",
	domain="analysis"
	)

	assert entry.tags == []
	assert entry.access_count == 0
	assert entry.success_rate == 1.0
	assert entry.related_entries == []
	assert entry.created_at > 0

	def test_to_dict_serialization(self):
	"""Test KnowledgeEntry serialization to dictionary."""
	entry = KnowledgeEntry(
	knowledge_id="serialize_test",
	knowledge_type=KnowledgeType.OPTIMIZATION_DATA,
	content={"metric": "efficiency", "value": 0.85},
	confidence_level=ConfidenceLevel.VERIFIED,
	source_agent="optimizer",
	domain="performance",
	tags=["optimization", "metrics"],
	access_count=5,
	success_rate=0.9,
	related_entries=["related_123"]
	)

	entry_dict = entry.to_dict()

	assert entry_dict["knowledge_id"] == "serialize_test"
	assert entry_dict["knowledge_type"] == "optimization_data"
	assert entry_dict["confidence_level"] == "verified"
	assert entry_dict["content"]["metric"] == "efficiency"
	assert entry_dict["source_agent"] == "optimizer"
	assert entry_dict["domain"] == "performance"
	assert entry_dict["tags"] == ["optimization", "metrics"]
	assert entry_dict["access_count"] == 5
	assert entry_dict["success_rate"] == 0.9
	assert entry_dict["related_entries"] == ["related_123"]

	def test_from_dict_deserialization(self):
	"""Test KnowledgeEntry deserialization from dictionary."""
	data = {
	"knowledge_id": "deserialize_test",
	"knowledge_type": "pattern_recognition",
	"content": {"pattern": "helix_convergence", "accuracy": 0.92},
	"confidence_level": "high",
	"source_agent": "pattern_detector",
	"domain": "geometry",
	"tags": ["patterns", "helix"],
	"created_at": 1640995200.0,
	"updated_at": 1640995300.0,
	"access_count": 3,
	"success_rate": 0.85,
	"related_entries": ["pattern_456"]
	}

	entry = KnowledgeEntry.from_dict(data)

	assert entry.knowledge_id == "deserialize_test"
	assert entry.knowledge_type == KnowledgeType.PATTERN_RECOGNITION
	assert entry.confidence_level == ConfidenceLevel.HIGH
	assert entry.content["pattern"] == "helix_convergence"
	assert entry.source_agent == "pattern_detector"
	assert entry.domain == "geometry"
	assert entry.tags == ["patterns", "helix"]
	assert entry.created_at == 1640995200.0
	assert entry.access_count == 3
	assert entry.success_rate == 0.85


	class TestKnowledgeQuery:
	"""Test KnowledgeQuery configuration."""

	def test_knowledge_query_defaults(self):
	"""Test KnowledgeQuery with default values."""
	query = KnowledgeQuery()

	assert query.knowledge_types is None
	assert query.domains is None
	assert query.tags is None
	assert query.min_confidence is None
	assert query.min_success_rate is None
	assert query.content_keywords is None
	assert query.time_range is None
	assert query.limit == 10

	def test_knowledge_query_specific_filters(self):
	"""Test KnowledgeQuery with specific filters."""
	query = KnowledgeQuery(
	knowledge_types=[KnowledgeType.TASK_RESULT, KnowledgeType.AGENT_INSIGHT],
	domains=["writing", "analysis"],
	tags=["blog", "research"],
	min_confidence=ConfidenceLevel.MEDIUM,
	min_success_rate=0.7,
	content_keywords=["optimization", "efficiency"],
	time_range=(1640995200.0, 1640995800.0),
	limit=25
	)

	assert len(query.knowledge_types) == 2
	assert KnowledgeType.TASK_RESULT in query.knowledge_types
	assert query.domains == ["writing", "analysis"]
	assert query.tags == ["blog", "research"]
	assert query.min_confidence == ConfidenceLevel.MEDIUM
	assert query.min_success_rate == 0.7
	assert query.content_keywords == ["optimization", "efficiency"]
	assert query.time_range == (1640995200.0, 1640995800.0)
	assert query.limit == 25


	class TestKnowledgeStore:
	"""Test KnowledgeStore functionality."""

	@pytest.fixture
	def temp_db_path(self):
	"""Create temporary database file for testing."""
	with tempfile.NamedTemporaryFile(suffix=".db", delete=False) as temp_file:
	temp_path = temp_file.name
	yield temp_path
	# Cleanup after test
	if os.path.exists(temp_path):
	os.unlink(temp_path)

	@pytest.fixture
	def knowledge_store(self, temp_db_path):
	"""Create KnowledgeStore instance for testing."""
	return KnowledgeStore(storage_path=temp_db_path, enable_compression=False)

	@pytest.fixture
	def compressed_store(self, temp_db_path):
	"""Create KnowledgeStore with compression enabled."""
	return KnowledgeStore(storage_path=temp_db_path, enable_compression=True)

	def test_knowledge_store_initialization(self, temp_db_path):
	"""Test KnowledgeStore initialization and database creation."""
	store = KnowledgeStore(storage_path=temp_db_path)

	assert store.storage_path == Path(temp_db_path)
	assert store.enable_compression is True # Default
	assert os.path.exists(temp_db_path)

	# Verify database schema
	with sqlite3.connect(temp_db_path) as conn:
	cursor = conn.execute("""
	SELECT name FROM sqlite_master
	WHERE type='table' AND name='knowledge_entries'
	""")
	assert cursor.fetchone() is not None

	def test_database_initialization_with_indexes(self, temp_db_path):
	"""Test that database indexes are created correctly."""
	store = KnowledgeStore(storage_path=temp_db_path)

	with sqlite3.connect(temp_db_path) as conn:
	cursor = conn.execute("""
	SELECT name FROM sqlite_master
	WHERE type='index' AND tbl_name='knowledge_entries'
	""")
	indexes = [row[0] for row in cursor.fetchall()]

	# Check that required indexes exist
	expected_indexes = [
	"idx_knowledge_type", "idx_domain",
	"idx_confidence", "idx_created_at"
	]
	for index in expected_indexes:
	assert index in indexes

	def test_generate_knowledge_id(self, knowledge_store):
	"""Test knowledge ID generation."""
	content1 = {"task": "writing", "result": "success"}
	content2 = {"task": "analysis", "result": "complete"}

	# Same content and agent should generate different IDs (due to timestamp)
	with patch('time.time', return_value=1640995200.0):
	id1 = knowledge_store._generate_knowledge_id(content1, "agent1")
	with patch('time.time', return_value=1640995300.0):
	id2 = knowledge_store._generate_knowledge_id(content1, "agent1")

	assert id1 != id2
	assert len(id1) == 16 # SHA256 truncated to 16 chars
	assert len(id2) == 16

	# Different content should generate different IDs
	id3 = knowledge_store._generate_knowledge_id(content2, "agent1")
	assert id3 != id1

	def test_compress_decompress_content(self, knowledge_store):
	"""Test content compression and decompression."""
	content = {
	"large_data": "x" * 2000, # Large content
	"nested": {"data": [1, 2, 3, 4, 5]},
	"metadata": {"timestamp": 1640995200.0}
	}

	compressed = knowledge_store._compress_content(content)
	assert isinstance(compressed, bytes)
	assert len(compressed) < len(json.dumps(content)) # Should be smaller

	decompressed = knowledge_store._decompress_content(compressed)
	assert decompressed == content

	def test_store_knowledge_basic(self, knowledge_store):
	"""Test basic knowledge storage."""
	content = {"task": "blog_writing", "outcome": "successful"}

	knowledge_id = knowledge_store.store_knowledge(
	knowledge_type=KnowledgeType.TASK_RESULT,
	content=content,
	confidence_level=ConfidenceLevel.HIGH,
	source_agent="writer_agent",
	domain="writing",
	tags=["blog", "success"]
	)

	assert isinstance(knowledge_id, str)
	assert len(knowledge_id) == 16

	# Verify data is stored in database
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT knowledge_id, knowledge_type, content_json, source_agent, domain
	FROM knowledge_entries WHERE knowledge_id = ?
	""", (knowledge_id,))
	row = cursor.fetchone()

	assert row is not None
	assert row[0] == knowledge_id
	assert row[1] == "task_result"
	assert json.loads(row[2]) == content
	assert row[3] == "writer_agent"
	assert row[4] == "writing"

	def test_store_knowledge_with_compression(self, compressed_store):
	"""Test knowledge storage with compression for large content."""
	# Create large content that should trigger compression
	large_content = {
	"description": "Large content " + "x" * 2000,
	"data": list(range(100)),
	"metadata": {"type": "performance_test"}
	}

	knowledge_id = compressed_store.store_knowledge(
	knowledge_type=KnowledgeType.OPTIMIZATION_DATA,
	content=large_content,
	confidence_level=ConfidenceLevel.MEDIUM,
	source_agent="performance_agent",
	domain="optimization"
	)

	# Verify compressed storage
	with sqlite3.connect(compressed_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT content_json, content_compressed
	FROM knowledge_entries WHERE knowledge_id = ?
	""", (knowledge_id,))
	row = cursor.fetchone()

	assert row[0] == "" # JSON should be empty (compressed)
	assert row[1] is not None # Compressed data should exist
	assert isinstance(row[1], bytes)

	def test_store_knowledge_without_tags(self, knowledge_store):
	"""Test storing knowledge without tags."""
	content = {"insight": "geometric convergence improves efficiency"}

	knowledge_id = knowledge_store.store_knowledge(
	knowledge_type=KnowledgeType.AGENT_INSIGHT,
	content=content,
	confidence_level=ConfidenceLevel.VERIFIED,
	source_agent="geometry_agent",
	domain="mathematics"
	# No tags parameter
	)

	# Verify empty tags are stored
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT tags_json FROM knowledge_entries WHERE knowledge_id = ?
	""", (knowledge_id,))
	tags_json = cursor.fetchone()[0]
	assert json.loads(tags_json) == []

	def test_retrieve_knowledge_basic(self, knowledge_store):
	"""Test basic knowledge retrieval."""
	# Store some test knowledge
	content1 = {"task": "writing", "result": "success"}
	id1 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, content1, ConfidenceLevel.HIGH,
	"writer", "writing", ["blog"]
	)

	content2 = {"pattern": "helix_convergence", "accuracy": 0.9}
	id2 = knowledge_store.store_knowledge(
	KnowledgeType.PATTERN_RECOGNITION, content2, ConfidenceLevel.MEDIUM,
	"analyzer", "geometry", ["patterns"]
	)

	# Retrieve all knowledge
	query = KnowledgeQuery(limit=10)
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 2
	assert all(isinstance(entry, KnowledgeEntry) for entry in results)

	# Results should be ordered by confidence, success rate, updated_at DESC
	assert results[0].confidence_level == ConfidenceLevel.HIGH # Higher confidence first

	def test_retrieve_knowledge_by_type(self, knowledge_store):
	"""Test knowledge retrieval filtered by type."""
	# Store different types of knowledge
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "success"}, ConfidenceLevel.HIGH,
	"agent1", "domain1"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "pattern"}, ConfidenceLevel.MEDIUM,
	"agent2", "domain2"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.OPTIMIZATION_DATA, {"metric": 0.8}, ConfidenceLevel.LOW,
	"agent3", "domain3"
	)

	# Query for specific types
	query = KnowledgeQuery(
	knowledge_types=[KnowledgeType.TASK_RESULT, KnowledgeType.AGENT_INSIGHT]
	)
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 2
	result_types = {entry.knowledge_type for entry in results}
	assert result_types == {KnowledgeType.TASK_RESULT, KnowledgeType.AGENT_INSIGHT}

	def test_retrieve_knowledge_by_domain(self, knowledge_store):
	"""Test knowledge retrieval filtered by domain."""
	# Store knowledge in different domains
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "success"}, ConfidenceLevel.HIGH,
	"agent1", "writing"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "pattern"}, ConfidenceLevel.MEDIUM,
	"agent2", "analysis"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.OPTIMIZATION_DATA, {"metric": 0.8}, ConfidenceLevel.HIGH,
	"agent3", "geometry"
	)

	# Query for specific domains
	query = KnowledgeQuery(domains=["writing", "geometry"])
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 2
	result_domains = {entry.domain for entry in results}
	assert result_domains == {"writing", "geometry"}

	def test_retrieve_knowledge_by_confidence(self, knowledge_store):
	"""Test knowledge retrieval filtered by confidence level."""
	# Store knowledge with different confidence levels
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "low"}, ConfidenceLevel.LOW,
	"agent1", "domain1"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "medium"}, ConfidenceLevel.MEDIUM,
	"agent2", "domain2"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "high"}, ConfidenceLevel.HIGH,
	"agent3", "domain3"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "verified"}, ConfidenceLevel.VERIFIED,
	"agent4", "domain4"
	)

	# Query for medium confidence and above
	query = KnowledgeQuery(min_confidence=ConfidenceLevel.MEDIUM)
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 3 # MEDIUM, HIGH, VERIFIED
	confidence_levels = {entry.confidence_level for entry in results}
	assert ConfidenceLevel.LOW not in confidence_levels
	assert all(level in [ConfidenceLevel.MEDIUM, ConfidenceLevel.HIGH, ConfidenceLevel.VERIFIED]
	for level in confidence_levels)

	def test_retrieve_knowledge_by_success_rate(self, knowledge_store):
	"""Test knowledge retrieval filtered by success rate."""
	# Store knowledge and update success rates
	id1 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "poor"}, ConfidenceLevel.HIGH,
	"agent1", "domain1"
	)
	id2 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "good"}, ConfidenceLevel.HIGH,
	"agent2", "domain2"
	)

	# Update success rates
	knowledge_store.update_success_rate(id1, 0.3) # Low success
	knowledge_store.update_success_rate(id2, 0.8) # High success

	# Query for high success rate only
	query = KnowledgeQuery(min_success_rate=0.7)
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 1
	assert results[0].success_rate >= 0.7
	assert results[0].content["result"] == "good"

	def test_retrieve_knowledge_by_time_range(self, knowledge_store):
	"""Test knowledge retrieval filtered by time range."""
	# Store knowledge at different times
	with patch('time.time', return_value=1640995200.0): # Jan 1, 2022
	id1 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "old"}, ConfidenceLevel.HIGH,
	"agent1", "domain1"
	)

	with patch('time.time', return_value=1672531200.0): # Jan 1, 2023
	id2 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "new"}, ConfidenceLevel.HIGH,
	"agent2", "domain2"
	)

	# Query for entries from 2023 only
	query = KnowledgeQuery(time_range=(1672531200.0 - 1, 1672531200.0 + 1))
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 1
	assert results[0].content["result"] == "new"

	def test_retrieve_knowledge_by_content_keywords(self, knowledge_store):
	"""Test knowledge retrieval filtered by content keywords."""
	# Store knowledge with different content
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT,
	{"description": "helix geometry optimization", "metric": 0.9},
	ConfidenceLevel.HIGH, "agent1", "geometry"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT,
	{"description": "blog writing improvements", "efficiency": 0.8},
	ConfidenceLevel.MEDIUM, "agent2", "writing"
	)

	# Query for content containing "helix"
	query = KnowledgeQuery(content_keywords=["helix"])
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 1
	assert "helix" in results[0].content["description"]

	def test_retrieve_knowledge_by_tags(self, knowledge_store):
	"""Test knowledge retrieval filtered by tags."""
	# Store knowledge with different tags
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "success"}, ConfidenceLevel.HIGH,
	"agent1", "domain1", ["blog", "writing", "success"]
	)
	knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "pattern"}, ConfidenceLevel.MEDIUM,
	"agent2", "domain2", ["analysis", "patterns", "geometry"]
	)

	# Query for entries with "blog" tag
	query = KnowledgeQuery(tags=["blog"])
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 1
	assert "blog" in results[0].tags

	def test_retrieve_knowledge_with_limit(self, knowledge_store):
	"""Test knowledge retrieval with result limit."""
	# Store multiple knowledge entries
	for i in range(5):
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"index": i}, ConfidenceLevel.HIGH,
	f"agent{i}", "domain"
	)

	# Query with limit
	query = KnowledgeQuery(limit=3)
	results = knowledge_store.retrieve_knowledge(query)

	assert len(results) == 3

	def test_retrieve_knowledge_access_count_update(self, knowledge_store):
	"""Test that access count is incremented during retrieval."""
	# Store knowledge
	knowledge_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "test"}, ConfidenceLevel.HIGH,
	"agent", "domain"
	)

	# Initial access count should be 0
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT access_count FROM knowledge_entries WHERE knowledge_id = ?
	""", (knowledge_id,))
	assert cursor.fetchone()[0] == 0

	# Retrieve knowledge (should increment access count)
	query = KnowledgeQuery()
	results = knowledge_store.retrieve_knowledge(query)

	# Access count should be incremented
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT access_count FROM knowledge_entries WHERE knowledge_id = ?
	""", (knowledge_id,))
	assert cursor.fetchone()[0] == 1

	def test_update_success_rate(self, knowledge_store):
	"""Test updating success rate for knowledge entry."""
	# Store knowledge
	knowledge_id = knowledge_store.store_knowledge(
	KnowledgeType.OPTIMIZATION_DATA, {"metric": "efficiency"},
	ConfidenceLevel.HIGH, "agent", "performance"
	)

	# Update success rate
	result = knowledge_store.update_success_rate(knowledge_id, 0.75)
	assert result is True

	# Verify update in database
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT success_rate, updated_at FROM knowledge_entries
	WHERE knowledge_id = ?
	""", (knowledge_id,))
	row = cursor.fetchone()

	assert row[0] == 0.75
	assert row[1] > time.time() - 5 # Recently updated

	def test_update_success_rate_nonexistent(self, knowledge_store):
	"""Test updating success rate for non-existent entry."""
	result = knowledge_store.update_success_rate("nonexistent_id", 0.5)
	assert result is False

	def test_add_related_entry(self, knowledge_store):
	"""Test adding relationships between knowledge entries."""
	# Store two knowledge entries
	id1 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "primary"},
	ConfidenceLevel.HIGH, "agent1", "domain1"
	)
	id2 = knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "related"},
	ConfidenceLevel.MEDIUM, "agent2", "domain2"
	)

	# Add relationship
	result = knowledge_store.add_related_entry(id1, id2)
	assert result is True

	# Verify relationship in database
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT related_entries_json FROM knowledge_entries
	WHERE knowledge_id = ?
	""", (id1,))
	related_json = cursor.fetchone()[0]
	related_entries = json.loads(related_json)

	assert id2 in related_entries

	def test_add_related_entry_duplicate(self, knowledge_store):
	"""Test adding duplicate relationship (should not duplicate)."""
	# Store knowledge entries and add relationship twice
	id1 = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "primary"},
	ConfidenceLevel.HIGH, "agent1", "domain1"
	)
	id2 = knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "related"},
	ConfidenceLevel.MEDIUM, "agent2", "domain2"
	)

	# Add relationship twice
	knowledge_store.add_related_entry(id1, id2)
	knowledge_store.add_related_entry(id1, id2)

	# Verify only one relationship exists
	with sqlite3.connect(knowledge_store.storage_path) as conn:
	cursor = conn.execute("""
	SELECT related_entries_json FROM knowledge_entries
	WHERE knowledge_id = ?
	""", (id1,))
	related_json = cursor.fetchone()[0]
	related_entries = json.loads(related_json)

	assert related_entries.count(id2) == 1

	def test_add_related_entry_nonexistent(self, knowledge_store):
	"""Test adding relationship to non-existent entry."""
	result = knowledge_store.add_related_entry("nonexistent_id", "some_id")
	assert result is False

	def test_get_knowledge_summary_empty(self, knowledge_store):
	"""Test knowledge summary for empty store."""
	summary = knowledge_store.get_knowledge_summary()

	assert summary["total_entries"] == 0
	assert summary["by_type"] == {}
	assert summary["by_domain"] == {}
	assert summary["by_confidence"] == {}
	assert summary["average_success_rate"] == 0.0
	assert "storage_path" in summary

	def test_get_knowledge_summary_populated(self, knowledge_store):
	"""Test knowledge summary for populated store."""
	# Store various types of knowledge
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result1": "success"},
	ConfidenceLevel.HIGH, "agent1", "writing"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result2": "success"},
	ConfidenceLevel.MEDIUM, "agent2", "writing"
	)
	knowledge_store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT, {"insight": "pattern"},
	ConfidenceLevel.HIGH, "agent3", "analysis"
	)

	summary = knowledge_store.get_knowledge_summary()

	assert summary["total_entries"] == 3
	assert summary["by_type"]["task_result"] == 2
	assert summary["by_type"]["agent_insight"] == 1
	assert summary["by_domain"]["writing"] == 2
	assert summary["by_domain"]["analysis"] == 1
	assert summary["by_confidence"]["high"] == 2
	assert summary["by_confidence"]["medium"] == 1
	assert summary["average_success_rate"] == 1.0 # All default to 1.0

	def test_cleanup_old_entries(self, knowledge_store):
	"""Test cleanup of old and low-performing entries."""
	current_time = time.time()
	old_time = current_time - (31 * 24 * 3600) # 31 days ago
	recent_time = current_time - (10 * 24 * 3600) # 10 days ago

	# Store entries with different ages and success rates
	with patch('time.time', return_value=old_time):
	old_bad_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "old_bad"},
	ConfidenceLevel.LOW, "agent1", "domain1"
	)
	old_good_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "old_good"},
	ConfidenceLevel.HIGH, "agent2", "domain2"
	)

	with patch('time.time', return_value=recent_time):
	recent_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "recent"},
	ConfidenceLevel.MEDIUM, "agent3", "domain3"
	)

	# Update success rates
	knowledge_store.update_success_rate(old_bad_id, 0.2) # Low success
	knowledge_store.update_success_rate(old_good_id, 0.8) # High success

	# Run cleanup (max_age_days=30, min_success_rate=0.3)
	deleted_count = knowledge_store.cleanup_old_entries(
	max_age_days=30, min_success_rate=0.3
	)

	# Should delete old entry with low success rate
	assert deleted_count == 1

	# Verify remaining entries
	query = KnowledgeQuery()
	remaining = knowledge_store.retrieve_knowledge(query)
	remaining_results = {entry.content.get("result") for entry in remaining}

	assert "old_bad" not in remaining_results # Should be deleted
	assert "old_good" in remaining_results # Should remain (good success rate)
	assert "recent" in remaining_results # Should remain (recent)

	def test_cleanup_unused_entries(self, knowledge_store):
	"""Test cleanup of unused entries (zero access count)."""
	current_time = time.time()
	old_time = current_time - (31 * 24 * 3600) # 31 days ago

	# Store old entry that's never been accessed
	with patch('time.time', return_value=old_time):
	unused_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "unused"},
	ConfidenceLevel.HIGH, "agent1", "domain1"
	)

	# Store entry and access it
	accessed_id = knowledge_store.store_knowledge(
	KnowledgeType.TASK_RESULT, {"result": "accessed"},
	ConfidenceLevel.HIGH, "agent2", "domain2"
	)

	# Access the second entry to increment access count
	query = KnowledgeQuery()
	knowledge_store.retrieve_knowledge(query)

	# Run cleanup - should delete unused old entry
	deleted_count = knowledge_store.cleanup_old_entries(max_age_days=30)

	assert deleted_count == 1 # Unused old entry deleted


	class TestIntegrationScenarios:
	"""Test integration scenarios for knowledge store system."""

	@pytest.fixture
	def temp_db_path(self):
	"""Create temporary database file for testing."""
	with tempfile.NamedTemporaryFile(suffix=".db", delete=False) as temp_file:
	temp_path = temp_file.name
	yield temp_path
	if os.path.exists(temp_path):
	os.unlink(temp_path)

	def test_blog_writing_knowledge_lifecycle(self, temp_db_path):
	"""Test complete knowledge lifecycle for blog writing scenario."""
	store = KnowledgeStore(storage_path=temp_db_path)

	# 1. Store initial task result
	task_result_id = store.store_knowledge(
	knowledge_type=KnowledgeType.TASK_RESULT,
	content={
	"task": "blog_writing",
	"topic": "AI ethics",
	"word_count": 1500,
	"quality_score": 0.85,
	"completion_time": 45.2,
	"agent_count": 5
	},
	confidence_level=ConfidenceLevel.HIGH,
	source_agent="blog_coordinator",
	domain="writing",
	tags=["blog", "AI", "ethics", "successful"]
	)

	# 2. Store agent insight about effective collaboration
	insight_id = store.store_knowledge(
	knowledge_type=KnowledgeType.AGENT_INSIGHT,
	content={
	"insight": "helix_convergence_pattern",
	"description": "Research agents spawning early improved topic coverage",
	"effectiveness": 0.92,
	"pattern_data": {
	"research_agents": 2,
	"analysis_agents": 2,
	"synthesis_agents": 1,
	"spawn_timing": [0.1, 0.3, 0.5, 0.7, 0.9]
	}
	},
	confidence_level=ConfidenceLevel.VERIFIED,
	source_agent="pattern_analyzer",
	domain="coordination",
	tags=["helix", "spawning", "collaboration", "patterns"]
	)

	# 3. Store optimization data
	optimization_id = store.store_knowledge(
	knowledge_type=KnowledgeType.OPTIMIZATION_DATA,
	content={
	"optimization_target": "completion_time",
	"baseline": 60.0,
	"optimized": 45.2,
	"improvement": 0.247,
	"technique": "dynamic_spawning",
	"parameters": {
	"confidence_threshold": 0.7,
	"max_agents": 5,
	"spawn_interval": 0.2
	}
	},
	confidence_level=ConfidenceLevel.HIGH,
	source_agent="optimizer",
	domain="performance",
	tags=["optimization", "timing", "dynamic_spawning"]
	)

	# 4. Add relationships between entries
	store.add_related_entry(task_result_id, insight_id)
	store.add_related_entry(task_result_id, optimization_id)
	store.add_related_entry(insight_id, optimization_id)

	# 5. Query for similar tasks (blog writing)
	blog_query = KnowledgeQuery(
	domains=["writing"],
	tags=["blog"],
	min_confidence=ConfidenceLevel.MEDIUM
	)
	blog_results = store.retrieve_knowledge(blog_query)

	assert len(blog_results) == 1
	assert blog_results[0].content["task"] == "blog_writing"
	assert "AI ethics" in blog_results[0].content["topic"]

	# 6. Query for optimization insights
	optimization_query = KnowledgeQuery(
	knowledge_types=[KnowledgeType.OPTIMIZATION_DATA],
	content_keywords=["dynamic_spawning"]
	)
	opt_results = store.retrieve_knowledge(optimization_query)

	assert len(opt_results) == 1
	assert opt_results[0].content["improvement"] > 0.2

	# 7. Query for coordination patterns
	pattern_query = KnowledgeQuery(
	knowledge_types=[KnowledgeType.AGENT_INSIGHT],
	tags=["helix", "patterns"]
	)
	pattern_results = store.retrieve_knowledge(pattern_query)

	assert len(pattern_results) == 1
	assert "helix_convergence_pattern" in pattern_results[0].content["insight"]

	# 8. Update success rates based on real usage
	store.update_success_rate(task_result_id, 0.9) # Very successful
	store.update_success_rate(insight_id, 0.95) # Extremely valuable
	store.update_success_rate(optimization_id, 0.85) # Good results

	# 9. Get knowledge summary
	summary = store.get_knowledge_summary()

	assert summary["total_entries"] == 3
	assert summary["by_domain"]["writing"] == 1
	assert summary["by_domain"]["coordination"] == 1
	assert summary["by_domain"]["performance"] == 1
	assert summary["average_success_rate"] > 0.85

	def test_cross_domain_knowledge_search(self, temp_db_path):
	"""Test searching for knowledge across multiple domains."""
	store = KnowledgeStore(storage_path=temp_db_path)

	# Store knowledge across different domains but related concepts
	# Technical domain - helix geometry
	store.store_knowledge(
	KnowledgeType.PATTERN_RECOGNITION,
	{
	"pattern": "geometric_convergence",
	"mathematical_model": "parametric_helix",
	"concentration_ratio": 4119,
	"precision": 1e-12
	},
	ConfidenceLevel.VERIFIED,
	"geometry_agent",
	"mathematics",
	["helix", "geometry", "convergence", "precision"]
	)

	# Performance domain - efficiency gains
	store.store_knowledge(
	KnowledgeType.OPTIMIZATION_DATA,
	{
	"optimization": "task_distribution",
	"architecture": "helix_spoke",
	"efficiency_gain": 0.441,
	"statistical_significance": 0.0441,
	"comparison": "vs_linear_pipeline"
	},
	ConfidenceLevel.HIGH,
	"performance_agent",
	"performance",
	["helix", "efficiency", "task_distribution", "statistical"]
	)

	# Coordination domain - agent spawning
	store.store_knowledge(
	KnowledgeType.AGENT_INSIGHT,
	{
	"coordination_pattern": "temporal_spawning",
	"helix_position": "all_spawn_at_top",
	"attention_focusing": "natural_convergence",
	"spawn_timing": "different_times_same_geometry"
	},
	ConfidenceLevel.HIGH,
	"coordinator_agent",
	"coordination",
	["helix", "spawning", "attention", "coordination"]
	)

	# Search across domains for helix-related knowledge
	helix_query = KnowledgeQuery(
	tags=["helix"],
	min_confidence=ConfidenceLevel.MEDIUM
	)
	helix_results = store.retrieve_knowledge(helix_query)

	assert len(helix_results) == 3
	domains = {entry.domain for entry in helix_results}
	assert domains == {"mathematics", "performance", "coordination"}

	# Search for high-precision, verified knowledge
	precision_query = KnowledgeQuery(
	content_keywords=["precision", "statistical"],
	min_confidence=ConfidenceLevel.HIGH
	)
	precision_results = store.retrieve_knowledge(precision_query)

	assert len(precision_results) == 2 # Mathematics and performance entries

	# Search for coordination-specific insights
	coordination_query = KnowledgeQuery(
	domains=["coordination"],
	knowledge_types=[KnowledgeType.AGENT_INSIGHT]
	)
	coord_results = store.retrieve_knowledge(coordination_query)

	assert len(coord_results) == 1
	assert "temporal_spawning" in coord_results[0].content["coordination_pattern"]

	def test_knowledge_evolution_over_time(self, temp_db_path):
	"""Test how knowledge evolves and gets refined over time."""
	store = KnowledgeStore(storage_path=temp_db_path)

	# Initial hypothesis with low confidence
	hypothesis_time = time.time() - (10 * 24 * 3600) # 10 days ago
	with patch('time.time', return_value=hypothesis_time):
	hypothesis_id = store.store_knowledge(
	KnowledgeType.DOMAIN_EXPERTISE,
	{
	"hypothesis": "helix_better_than_mesh",
	"initial_evidence": "theoretical_analysis",
	"confidence_factors": ["geometric_elegance", "o_n_complexity"],
	"uncertainty": "lacks_empirical_validation"
	},
	ConfidenceLevel.LOW,
	"theorist_agent",
	"research",
	["hypothesis", "helix", "mesh", "theory"]
	)

	# Experimental results with medium confidence
	experiment_time = time.time() - (5 * 24 * 3600) # 5 days ago
	with patch('time.time', return_value=experiment_time):
	experiment_id = store.store_knowledge(
	KnowledgeType.OPTIMIZATION_DATA,
	{
	"experiment": "helix_vs_mesh_performance",
	"metrics": {
	"task_distribution_efficiency": 0.441,
	"memory_efficiency": 0.75,
	"communication_overhead": "inconclusive"
	},
	"statistical_significance": 0.0441,
	"sample_size": 100
	},
	ConfidenceLevel.MEDIUM,
	"experimenter_agent",
	"validation",
	["experiment", "helix", "mesh", "performance", "statistical"]
	)

	# Verified conclusion with high confidence
	conclusion_time = time.time() - (1 * 24 * 3600) # 1 day ago
	with patch('time.time', return_value=conclusion_time):
	conclusion_id = store.store_knowledge(
	KnowledgeType.DOMAIN_EXPERTISE,
	{
	"conclusion": "helix_advantages_validated",
	"validated_benefits": [
	"task_distribution_efficiency",
	"memory_efficiency",
	"natural_attention_focusing"
	],
	"evidence_base": ["theoretical", "experimental", "statistical"],
	"publication_ready": True,
	"confidence_score": 0.95
	},
	ConfidenceLevel.VERIFIED,
	"validator_agent",
	"research",
	["conclusion", "helix", "validated", "publication"]
	)

	# Link related knowledge
	store.add_related_entry(hypothesis_id, experiment_id)
	store.add_related_entry(experiment_id, conclusion_id)
	store.add_related_entry(hypothesis_id, conclusion_id)

	# Update success rates based on validation
	store.update_success_rate(hypothesis_id, 0.8) # Good starting point
	store.update_success_rate(experiment_id, 0.9) # Solid experimental work
	store.update_success_rate(conclusion_id, 0.95) # Validated conclusion

	# Query for evolution of helix research
	research_evolution = KnowledgeQuery(
	domains=["research", "validation"],
	tags=["helix"],
	time_range=(hypothesis_time - 3600, conclusion_time + 3600) # Full range
	)
	evolution_results = store.retrieve_knowledge(research_evolution)

	assert len(evolution_results) == 3

	# Results should be ordered by confidence level (desc)
	confidence_levels = [entry.confidence_level for entry in evolution_results]
	assert confidence_levels[0] == ConfidenceLevel.VERIFIED # Most confident first

	# Query for high-confidence, validated knowledge only
	validated_query = KnowledgeQuery(
	min_confidence=ConfidenceLevel.HIGH,
	content_keywords=["validated", "publication"]
	)
	validated_results = store.retrieve_knowledge(validated_query)

	assert len(validated_results) == 1
	assert validated_results[0].content["publication_ready"] is True
	assert validated_results[0].confidence_level == ConfidenceLevel.VERIFIED