Spaces:

Chris4K
/

agent-memory

Running

App Files Files Community

agent-memory / memory /vector.py

Chris4K

Upload 17 files

ca376d8 verified 2 days ago

raw

history blame contribute delete

13.4 kB

	"""
	Semantic / Vector Memory – RAG Layer
	=====================================
	Long-term knowledge stored in ChromaDB with sentence-transformer embeddings.
	Also persists each entry as a Markdown file under memory/vector/*.md
	for human-readability and version control.

	This is the RAG backbone:
	• Add documents → embed + store
	• Query by natural language → cosine similarity search
	• Full CRUD with automatic re-embedding on update
	"""

	from __future__ import annotations

	import json
	import logging
	from datetime import datetime
	from pathlib import Path
	from typing import Any, Dict, List, Optional

	from .models import MemoryEntry, MemoryTier, SearchResult

	logger = logging.getLogger(__name__)

	# ── optional heavy deps (graceful fallback) ──────────────────
	try:
	import chromadb
	from chromadb.config import Settings as ChromaSettings
	CHROMA_AVAILABLE = True
	except ImportError:
	CHROMA_AVAILABLE = False

	try:
	from sentence_transformers import SentenceTransformer
	ST_AVAILABLE = True
	except ImportError:
	ST_AVAILABLE = False


	class _SentenceTransformerEmbedder:
	"""Wraps sentence-transformers for ChromaDB's EmbeddingFunction protocol."""

	def __init__(self, model_name: str = "all-MiniLM-L6-v2"):
	if not ST_AVAILABLE:
	raise ImportError("sentence-transformers is required for semantic memory")
	self.model = SentenceTransformer(model_name)
	self.model_name = model_name

	def __call__(self, input: List[str]) -> List[List[float]]:
	embeddings = self.model.encode(input, show_progress_bar=False)
	return embeddings.tolist()

	def name(self) -> str:
	"""Required by ChromaDB EmbeddingFunction protocol."""
	return f"sentence-transformers_{self.model_name}"


	class SemanticMemory:
	"""ChromaDB-backed vector store with Markdown file mirror."""

	COLLECTION_NAME = "memory_semantic"
	DEFAULT_MODEL = "all-MiniLM-L6-v2"

	def __init__(
	self,
	vector_dir: str = "memory/vector",
	md_dir: str = "memory/vector/docs",
	model_name: str = DEFAULT_MODEL,
	collection_name: str = COLLECTION_NAME,
	):
	self.vector_dir = Path(vector_dir)
	self.md_dir = Path(md_dir)
	self.vector_dir.mkdir(parents=True, exist_ok=True)
	self.md_dir.mkdir(parents=True, exist_ok=True)
	self.model_name = model_name
	self.collection_name = collection_name

	# ChromaDB setup
	if CHROMA_AVAILABLE:
	self._client = chromadb.PersistentClient(
	path=str(self.vector_dir / "chroma_db"),
	)
	# Embedding function
	if ST_AVAILABLE:
	self._embed_fn = _SentenceTransformerEmbedder(model_name)
	self._collection = self._client.get_or_create_collection(
	name=collection_name,
	embedding_function=self._embed_fn,
	metadata={"hnsw:space": "cosine"},
	)
	else:
	# fall back to Chroma's built-in default embedder
	self._collection = self._client.get_or_create_collection(
	name=collection_name,
	metadata={"hnsw:space": "cosine"},
	)
	self._embed_fn = None
	logger.info(
	"SemanticMemory ready – ChromaDB @ %s \| model=%s \| docs=%d",
	self.vector_dir, model_name, self._collection.count(),
	)
	else:
	self._client = None
	self._collection = None
	self._embed_fn = None
	logger.warning("chromadb not installed – semantic memory operates in file-only mode")

	# ── CRUD ─────────────────────────────────────────────────

	def create(
	self,
	content: str,
	title: str = "",
	tags: Optional[List[str]] = None,
	importance: float = 0.5,
	metadata: Optional[Dict[str, Any]] = None,
	source: str = "",
	) -> MemoryEntry:
	"""Add a new document to the vector store + Markdown mirror."""
	entry = MemoryEntry(
	content=content,
	title=title or content[:80],
	tier=MemoryTier.SEMANTIC,
	tags=tags or [],
	importance=importance,
	metadata=metadata or {},
	source=source,
	created_at=datetime.utcnow().isoformat(),
	updated_at=datetime.utcnow().isoformat(),
	)
	self._upsert_vector(entry)
	self._persist_md(entry)
	return entry

	def read(self, entry_id: str) -> Optional[MemoryEntry]:
	"""Retrieve by ID."""
	if self._collection is None:
	return self._read_from_md(entry_id)
	try:
	result = self._collection.get(ids=[entry_id], include=["documents", "metadatas"])
	if not result["ids"]:
	return None
	entry = self._result_to_entry(result, 0)
	entry.access_count += 1
	entry.updated_at = datetime.utcnow().isoformat()
	self._upsert_vector(entry)
	self._persist_md(entry)
	return entry
	except Exception as exc:
	logger.error("read failed: %s", exc)
	return self._read_from_md(entry_id)

	def update(self, entry_id: str, **kwargs) -> Optional[MemoryEntry]:
	"""Update fields and re-embed if content changed."""
	entry = self.read(entry_id)
	if not entry:
	return None
	for k, v in kwargs.items():
	if hasattr(entry, k) and k not in ("id", "tier", "created_at"):
	setattr(entry, k, v)
	entry.updated_at = datetime.utcnow().isoformat()
	self._upsert_vector(entry)
	self._persist_md(entry)
	return entry

	def delete(self, entry_id: str) -> bool:
	"""Remove from vector store and disk."""
	if self._collection is not None:
	try:
	self._collection.delete(ids=[entry_id])
	except Exception:
	pass
	md_path = self.md_dir / f"{entry_id}.md"
	if md_path.exists():
	md_path.unlink()
	return True
	return False

	# ── search / RAG ─────────────────────────────────────────

	def search(
	self,
	query: str,
	limit: int = 5,
	where: Optional[Dict[str, Any]] = None,
	) -> List[SearchResult]:
	"""Semantic similarity search. This is the RAG retrieval endpoint."""
	if self._collection is None:
	return self._keyword_fallback(query, limit)

	kwargs: Dict[str, Any] = {
	"query_texts": [query],
	"n_results": min(limit, self._collection.count() or 1),
	"include": ["documents", "metadatas", "distances"],
	}
	if where:
	kwargs["where"] = where

	try:
	results = self._collection.query(**kwargs)
	except Exception as exc:
	logger.error("vector search failed: %s", exc)
	return self._keyword_fallback(query, limit)

	search_results: List[SearchResult] = []
	if results and results["ids"] and results["ids"][0]:
	for idx in range(len(results["ids"][0])):
	entry = self._query_result_to_entry(results, idx)
	dist = results["distances"][0][idx] if results.get("distances") else 0
	score = max(0.0, 1.0 - dist) # cosine distance → similarity
	search_results.append(SearchResult(entry=entry, score=score, distance=dist))

	return search_results

	def list_entries(self, limit: int = 100, tag: Optional[str] = None) -> List[MemoryEntry]:
	"""List all stored entries (up to limit)."""
	if self._collection is None:
	return self._list_from_md(limit, tag)

	result = self._collection.get(
	include=["documents", "metadatas"],
	limit=limit,
	)
	entries = []
	for idx in range(len(result["ids"])):
	entry = self._result_to_entry(result, idx)
	if tag and tag not in entry.tags:
	continue
	entries.append(entry)
	return entries

	def count(self) -> int:
	if self._collection is not None:
	return self._collection.count()
	return len(list(self.md_dir.glob("*.md")))

	# ── internals ────────────────────────────────────────────

	def _upsert_vector(self, entry: MemoryEntry):
	if self._collection is None:
	return
	meta = {
	"title": entry.title,
	"tier": entry.tier.value,
	"tags": json.dumps(entry.tags),
	"importance": entry.importance,
	"access_count": entry.access_count,
	"created_at": entry.created_at,
	"updated_at": entry.updated_at,
	"source": entry.source,
	}
	self._collection.upsert(
	ids=[entry.id],
	documents=[entry.content],
	metadatas=[meta],
	)

	def _persist_md(self, entry: MemoryEntry):
	path = self.md_dir / f"{entry.id}.md"
	path.write_text(entry.to_markdown(), encoding="utf-8")

	def _read_from_md(self, entry_id: str) -> Optional[MemoryEntry]:
	path = self.md_dir / f"{entry_id}.md"
	if not path.exists():
	return None
	text = path.read_text(encoding="utf-8")
	return MemoryEntry.from_markdown(text)

	def _result_to_entry(self, result: dict, idx: int) -> MemoryEntry:
	meta = result["metadatas"][idx] if result.get("metadatas") else {}
	doc = result["documents"][idx] if result.get("documents") else ""
	entry_id = result["ids"][idx]
	tags = []
	if "tags" in meta:
	try:
	tags = json.loads(meta["tags"])
	except (json.JSONDecodeError, TypeError):
	tags = []
	return MemoryEntry(
	id=entry_id,
	content=doc,
	title=meta.get("title", ""),
	tier=MemoryTier.SEMANTIC,
	tags=tags,
	importance=float(meta.get("importance", 0.5)),
	access_count=int(meta.get("access_count", 0)),
	created_at=meta.get("created_at", ""),
	updated_at=meta.get("updated_at", ""),
	source=meta.get("source", ""),
	)

	def _query_result_to_entry(self, results: dict, idx: int) -> MemoryEntry:
	meta = results["metadatas"][0][idx] if results.get("metadatas") else {}
	doc = results["documents"][0][idx] if results.get("documents") else ""
	entry_id = results["ids"][0][idx]
	tags = []
	if "tags" in meta:
	try:
	tags = json.loads(meta["tags"])
	except (json.JSONDecodeError, TypeError):
	tags = []
	return MemoryEntry(
	id=entry_id,
	content=doc,
	title=meta.get("title", ""),
	tier=MemoryTier.SEMANTIC,
	tags=tags,
	importance=float(meta.get("importance", 0.5)),
	access_count=int(meta.get("access_count", 0)),
	created_at=meta.get("created_at", ""),
	updated_at=meta.get("updated_at", ""),
	source=meta.get("source", ""),
	)

	def _keyword_fallback(self, query: str, limit: int) -> List[SearchResult]:
	"""When ChromaDB is unavailable, fall back to keyword search over MD files."""
	q = query.lower()
	results: List[SearchResult] = []
	for md_file in self.md_dir.glob("*.md"):
	try:
	text = md_file.read_text(encoding="utf-8")
	if q in text.lower():
	entry = MemoryEntry.from_markdown(text)
	entry.tier = MemoryTier.SEMANTIC
	results.append(SearchResult(entry=entry, score=0.5))
	if len(results) >= limit:
	break
	except Exception:
	pass
	return results

	def _list_from_md(self, limit: int, tag: Optional[str]) -> List[MemoryEntry]:
	entries: List[MemoryEntry] = []
	for md_file in sorted(self.md_dir.glob("*.md"), reverse=True):
	try:
	text = md_file.read_text(encoding="utf-8")
	entry = MemoryEntry.from_markdown(text)
	entry.tier = MemoryTier.SEMANTIC
	if tag and tag not in entry.tags:
	continue
	entries.append(entry)
	if len(entries) >= limit:
	break
	except Exception:
	pass
	return entries