Spaces:

frontier-ai
/

gMAS

Running

File size: 25,591 Bytes
"""
Agent memory system with stratified levels, sharing, and hidden channels.

Supports:
- Memory stratification (working/long-term memory)
- TTL and size limits
- Compression and truncation
- Cross-subgraph sharing with access filters
- External storage backends
- Hidden channels (hidden_state, embeddings)
"""

import time
from abc import ABC, abstractmethod
from collections.abc import Callable
from enum import Enum
from typing import Any, Protocol, runtime_checkable

import torch
from pydantic import BaseModel, ConfigDict, Field

__all__ = [
    "AccessFilter",
    "AgentMemory",
    "AsyncMemoryStorage",
    "CompressionStrategy",
    "HiddenChannel",
    "MemoryConfig",
    "MemoryEntry",
    "MemoryLevel",
    "MemoryStorage",
    "Message",
    "MessageProtocol",
    "SharedMemoryPool",
    "SharingPolicy",
    "SummaryCompressor",
    "TruncateCompressor",
]


class MemoryLevel(str, Enum):
    WORKING = "working"
    LONG_TERM = "long_term"
    SHARED = "shared"


class MemoryEntry(BaseModel):
    """Memory entry with TTL, priority, and metadata."""

    content: dict[str, Any]
    level: MemoryLevel = MemoryLevel.WORKING
    created_at: float = Field(default_factory=time.time)
    accessed_at: float = Field(default_factory=time.time)
    ttl: float | None = None
    priority: int = 0
    tags: set[str] = Field(default_factory=set)
    source_agent: str | None = None

    @property
    def is_expired(self) -> bool:
        """True if the TTL has expired."""
        if self.ttl is None:
            return False
        return time.time() - self.created_at > self.ttl

    def touch(self) -> None:
        """Update the last-accessed timestamp."""
        self.accessed_at = time.time()

    @property
    def age(self) -> float:
        """Age of the entry in seconds."""
        return time.time() - self.created_at


class CompressionStrategy(ABC):
    """Abstract base strategy for compressing a collection of MemoryEntry objects."""

    @abstractmethod
    def compress(
        self,
        entries: list[MemoryEntry],
        max_entries: int,
    ) -> list[MemoryEntry]: ...


class TruncateCompressor(CompressionStrategy):
    """Compressor that keeps a limited number of entries ordered by priority and recency."""

    def __init__(self, *, keep_recent: bool = True, keep_high_priority: bool = True):
        self.keep_recent = keep_recent
        self.keep_high_priority = keep_high_priority

    def compress(
        self,
        entries: list[MemoryEntry],
        max_entries: int,
    ) -> list[MemoryEntry]:
        """Trim entries beyond the limit according to the sorting strategy."""
        if len(entries) <= max_entries:
            return entries

        def sort_key(e: MemoryEntry) -> tuple[int, float]:
            priority = -e.priority if self.keep_high_priority else 0
            age = -e.accessed_at if self.keep_recent else e.accessed_at
            return (priority, age)

        sorted_entries = sorted(entries, key=sort_key)
        return sorted_entries[:max_entries]


class SummaryCompressor(CompressionStrategy):
    """Compressor that collapses old entries into a summary using a summarizer callable."""

    def __init__(
        self,
        summarizer: Callable[[list[dict[str, Any]]], dict[str, Any]] | None = None,
        batch_size: int = 5,
    ):
        self.summarizer = summarizer
        self.batch_size = batch_size

    def compress(
        self,
        entries: list[MemoryEntry],
        max_entries: int,
    ) -> list[MemoryEntry]:
        """Compress entries, keeping a summary of old ones plus the most recent."""
        if len(entries) <= max_entries or self.summarizer is None:
            return entries[-max_entries:] if len(entries) > max_entries else entries

        to_keep = entries[-(max_entries - 1) :]
        to_summarize = entries[: -(max_entries - 1)]

        summary_content = self.summarizer([e.content for e in to_summarize])

        summary_entry = MemoryEntry(
            content=summary_content,
            level=MemoryLevel.LONG_TERM,
            priority=max(e.priority for e in to_summarize) if to_summarize else 0,
            tags=set().union(*(e.tags for e in to_summarize)),
        )

        return [summary_entry, *to_keep]


class MemoryConfig(BaseModel):
    """Configuration for agent memory capacity, TTL, and compression strategy."""

    model_config = ConfigDict(arbitrary_types_allowed=True)

    working_max_entries: int = 20
    working_default_ttl: float | None = 3600.0
    long_term_max_entries: int = 100
    long_term_default_ttl: float | None = None
    compression_strategy: CompressionStrategy = Field(default_factory=lambda: TruncateCompressor())
    auto_compress: bool = True
    promote_after_accesses: int = 3
    demote_inactive_after: float = 7200.0
    cleanup_interval: float = 300.0
    hidden_state_dim: int | None = None


class AgentMemory:
    """Agent memory manager with working/long-term levels and hidden channels."""

    def __init__(
        self,
        agent_id: str,
        config: MemoryConfig | None = None,
    ):
        self.agent_id = agent_id
        self.config = config or MemoryConfig()

        self._working: list[MemoryEntry] = []
        self._long_term: list[MemoryEntry] = []
        self._access_counts: dict[int, int] = {}
        self._last_cleanup = time.time()

        self._hidden_state: torch.Tensor | None = None
        self._embedding: torch.Tensor | None = None

    @property
    def working_memory(self) -> list[MemoryEntry]:
        """Active working-memory entries (expired entries excluded)."""
        self._maybe_cleanup()
        return [e for e in self._working if not e.is_expired]

    @property
    def long_term_memory(self) -> list[MemoryEntry]:
        """Active long-term memory entries (expired entries excluded)."""
        return [e for e in self._long_term if not e.is_expired]

    @property
    def all_entries(self) -> list[MemoryEntry]:
        """All entries from both zones (with TTL filtering applied)."""
        return self.working_memory + self.long_term_memory

    @property
    def hidden_state(self) -> torch.Tensor | None:
        return self._hidden_state

    @hidden_state.setter
    def hidden_state(self, value: torch.Tensor | None) -> None:
        self._hidden_state = value

    @property
    def embedding(self) -> torch.Tensor | None:
        return self._embedding

    @embedding.setter
    def embedding(self, value: torch.Tensor | None) -> None:
        self._embedding = value

    def add(
        self,
        content: dict[str, Any],
        level: MemoryLevel = MemoryLevel.WORKING,
        ttl: float | None = None,
        priority: int = 0,
        tags: set[str] | None = None,
        source_agent: str | None = None,
    ) -> MemoryEntry:
        """Add an entry to the specified memory level."""
        if ttl is None:
            ttl = self.config.working_default_ttl if level == MemoryLevel.WORKING else self.config.long_term_default_ttl

        entry = MemoryEntry(
            content=content,
            level=level,
            ttl=ttl,
            priority=priority,
            tags=tags or set(),
            source_agent=source_agent,
        )

        if level == MemoryLevel.WORKING:
            self._working.append(entry)
            self._maybe_compress_working()
        else:
            self._long_term.append(entry)
            self._maybe_compress_long_term()

        return entry

    def add_message(
        self,
        role: str,
        content: str,
        **metadata,
    ) -> MemoryEntry:
        """Convenience method for adding a chat message."""
        return self.add(
            content={"role": role, "content": content, **metadata},
            level=MemoryLevel.WORKING,
        )

    def get(
        self,
        level: MemoryLevel | None = None,
        tags: set[str] | None = None,
        limit: int | None = None,
        *,
        include_expired: bool = False,
    ) -> list[MemoryEntry]:
        """Retrieve entries filtered by level, tags, and/or limit."""
        if level == MemoryLevel.WORKING:
            entries = self._working
        elif level == MemoryLevel.LONG_TERM:
            entries = self._long_term
        else:
            entries = self._working + self._long_term

        if not include_expired:
            entries = [e for e in entries if not e.is_expired]

        if tags:
            entries = [e for e in entries if tags & e.tags]

        if limit:
            entries = entries[-limit:]

        for entry in entries:
            entry.touch()
            entry_id = id(entry)
            self._access_counts[entry_id] = self._access_counts.get(entry_id, 0) + 1

            if (
                entry.level == MemoryLevel.WORKING
                and self._access_counts[entry_id] >= self.config.promote_after_accesses
            ):
                self._promote(entry)

        return entries

    def get_messages(self, limit: int | None = None) -> list[dict[str, Any]]:
        """Return contents of entries that contain a 'role' field (chat messages)."""
        entries = self.get(limit=limit)
        return [e.content for e in entries if "role" in e.content]

    def clear(self, level: MemoryLevel | None = None) -> None:
        """Clear the specified memory level, or all levels if None."""
        if level is None or level == MemoryLevel.WORKING:
            self._working.clear()
        if level is None or level == MemoryLevel.LONG_TERM:
            self._long_term.clear()
        self._access_counts.clear()

    def remove_expired(self) -> int:
        """Remove expired entries and return the number removed."""
        before = len(self._working) + len(self._long_term)
        self._working = [e for e in self._working if not e.is_expired]
        self._long_term = [e for e in self._long_term if not e.is_expired]
        after = len(self._working) + len(self._long_term)
        return before - after

    def _promote(self, entry: MemoryEntry) -> None:
        if entry in self._working:
            self._working.remove(entry)
            entry.level = MemoryLevel.LONG_TERM
            entry.ttl = self.config.long_term_default_ttl
            self._long_term.append(entry)

    def _demote(self, entry: MemoryEntry) -> None:
        if entry in self._long_term:
            self._long_term.remove(entry)
            entry.level = MemoryLevel.WORKING
            entry.ttl = self.config.working_default_ttl
            self._working.append(entry)

    def _maybe_compress_working(self) -> None:
        if not self.config.auto_compress:
            return
        if len(self._working) > self.config.working_max_entries:
            self._working = self.config.compression_strategy.compress(self._working, self.config.working_max_entries)

    def _maybe_compress_long_term(self) -> None:
        if not self.config.auto_compress:
            return
        if len(self._long_term) > self.config.long_term_max_entries:
            self._long_term = self.config.compression_strategy.compress(
                self._long_term, self.config.long_term_max_entries
            )

    def _maybe_cleanup(self) -> None:
        now = time.time()
        if now - self._last_cleanup < self.config.cleanup_interval:
            return

        self._last_cleanup = now
        self.remove_expired()

        inactive_threshold = now - self.config.demote_inactive_after
        for entry in list(self._long_term):
            if entry.accessed_at < inactive_threshold:
                self._demote(entry)

    def to_dict(self) -> dict[str, Any]:
        """Serialize agent memory for persistence."""
        return {
            "agent_id": self.agent_id,
            "working": [
                {
                    "content": e.content,
                    "created_at": e.created_at,
                    "ttl": e.ttl,
                    "priority": e.priority,
                    "tags": list(e.tags),
                }
                for e in self._working
            ],
            "long_term": [
                {
                    "content": e.content,
                    "created_at": e.created_at,
                    "ttl": e.ttl,
                    "priority": e.priority,
                    "tags": list(e.tags),
                }
                for e in self._long_term
            ],
            "hidden_state": (self._hidden_state.cpu().tolist() if self._hidden_state is not None else None),
            "embedding": (self._embedding.cpu().tolist() if self._embedding is not None else None),
        }

    @classmethod
    def from_dict(
        cls,
        data: dict[str, Any],
        config: MemoryConfig | None = None,
    ) -> "AgentMemory":
        """Restore an AgentMemory instance from a dictionary."""
        memory = cls(data["agent_id"], config)

        for e_data in data.get("working", []):
            entry = MemoryEntry(
                content=e_data["content"],
                level=MemoryLevel.WORKING,
                created_at=e_data.get("created_at", time.time()),
                ttl=e_data.get("ttl"),
                priority=e_data.get("priority", 0),
                tags=set(e_data.get("tags", [])),
            )
            memory._working.append(entry)

        for e_data in data.get("long_term", []):
            entry = MemoryEntry(
                content=e_data["content"],
                level=MemoryLevel.LONG_TERM,
                created_at=e_data.get("created_at", time.time()),
                ttl=e_data.get("ttl"),
                priority=e_data.get("priority", 0),
                tags=set(e_data.get("tags", [])),
            )
            memory._long_term.append(entry)

        if data.get("hidden_state"):
            memory._hidden_state = torch.tensor(data["hidden_state"])
        if data.get("embedding"):
            memory._embedding = torch.tensor(data["embedding"])

        return memory


class AccessFilter(ABC):
    """Interface for access filters on shared memory."""

    @abstractmethod
    def can_access(
        self,
        requester_id: str,
        owner_id: str,
        entry: MemoryEntry,
    ) -> bool: ...


class SharingPolicy(str, Enum):
    NONE = "none"
    SAME_SUBGRAPH = "same_subgraph"
    BY_TAGS = "by_tags"
    BY_ROLE_FAMILY = "by_role_family"
    FULL = "full"


class TagBasedFilter(AccessFilter):
    """Access filter that grants access based on overlapping tags."""

    def __init__(self, shared_tags: set[str]):
        self.shared_tags = shared_tags

    def can_access(
        self,
        requester_id: str,
        owner_id: str,
        entry: MemoryEntry,
    ) -> bool:
        del requester_id, owner_id  # Unused in this filter implementation
        return bool(entry.tags & self.shared_tags)


class SubgraphFilter(AccessFilter):
    """Access filter that restricts access to agents in the same subgraph."""

    def __init__(self, subgraph_members: dict[str, set[str]]):
        self.subgraph_members = subgraph_members
        self._agent_to_subgraph: dict[str, str] = {}
        for sg_id, members in subgraph_members.items():
            for member in members:
                self._agent_to_subgraph[member] = sg_id

    def can_access(
        self,
        requester_id: str,
        owner_id: str,
        entry: MemoryEntry,
    ) -> bool:
        del entry  # Unused in this filter implementation
        req_sg = self._agent_to_subgraph.get(requester_id)
        own_sg = self._agent_to_subgraph.get(owner_id)
        return req_sg is not None and req_sg == own_sg


class RoleFamilyFilter(AccessFilter):
    """Access filter that restricts access to agents belonging to the same role family."""

    def __init__(self, role_families: dict[str, set[str]]):
        self.role_families = role_families
        self._agent_to_family: dict[str, str] = {}
        for family, members in role_families.items():
            for member in members:
                self._agent_to_family[member] = family

    def can_access(
        self,
        requester_id: str,
        owner_id: str,
        entry: MemoryEntry,
    ) -> bool:
        del entry  # Unused in this filter implementation
        req_fam = self._agent_to_family.get(requester_id)
        own_fam = self._agent_to_family.get(owner_id)
        return req_fam is not None and req_fam == own_fam


class SharedMemoryPool:
    """Shared memory pool with configurable access and propagation policies."""

    def __init__(
        self,
        access_filter: AccessFilter | None = None,
        default_policy: SharingPolicy = SharingPolicy.BY_TAGS,
    ):
        self.access_filter = access_filter
        self.default_policy = default_policy
        self._memories: dict[str, AgentMemory] = {}
        self._shared_entries: list[MemoryEntry] = []

    def register(self, memory: AgentMemory) -> None:
        self._memories[memory.agent_id] = memory

    def unregister(self, agent_id: str) -> None:
        self._memories.pop(agent_id, None)

    def share(
        self,
        from_agent: str,
        entry: MemoryEntry,
        to_agents: list[str] | None = None,
    ) -> None:
        """Share an entry with specific agents or place it in the shared pool."""
        shared_entry = MemoryEntry(
            content=entry.content.copy(),
            level=MemoryLevel.SHARED,
            ttl=entry.ttl,
            priority=entry.priority,
            tags=entry.tags.copy(),
            source_agent=from_agent,
        )

        if to_agents:
            for agent_id in to_agents:
                if agent_id in self._memories:
                    self._memories[agent_id].add(
                        content=shared_entry.content,
                        level=MemoryLevel.WORKING,
                        priority=shared_entry.priority,
                        tags=shared_entry.tags | {"shared"},
                        source_agent=from_agent,
                    )
        else:
            self._shared_entries.append(shared_entry)

    def get_shared(
        self,
        requester_id: str,
        tags: set[str] | None = None,
        limit: int | None = None,
    ) -> list[MemoryEntry]:
        """Retrieve entries from the shared pool, respecting the access filter."""
        entries = []

        for entry in self._shared_entries:
            if (
                self.access_filter
                and entry.source_agent
                and not self.access_filter.can_access(requester_id, entry.source_agent, entry)
            ):
                continue

            if tags and not (tags & entry.tags):
                continue

            if not entry.is_expired:
                entries.append(entry)

        if limit:
            entries = entries[-limit:]

        return entries

    def get_from_agent(
        self,
        requester_id: str,
        owner_id: str,
        level: MemoryLevel | None = None,
        tags: set[str] | None = None,
    ) -> list[MemoryEntry]:
        """Retrieve entries from a specific agent, subject to the access filter."""
        if owner_id not in self._memories:
            return []

        owner_memory = self._memories[owner_id]
        entries = owner_memory.get(level=level, tags=tags)

        if self.access_filter:
            entries = [e for e in entries if self.access_filter.can_access(requester_id, owner_id, e)]

        return entries

    def broadcast(
        self,
        from_agent: str,
        content: dict[str, Any],
        tags: set[str] | None = None,
    ) -> None:
        """Broadcast an entry to all registered agents except the sender."""
        for agent_id, memory in self._memories.items():
            if agent_id != from_agent:
                memory.add(
                    content=content,
                    level=MemoryLevel.WORKING,
                    tags=(tags or set()) | {"broadcast"},
                    source_agent=from_agent,
                )


@runtime_checkable
class MemoryStorage(Protocol):
    def save_memory(self, agent_id: str, memory: AgentMemory) -> None: ...

    def load_memory(self, agent_id: str) -> AgentMemory | None: ...

    def delete_memory(self, agent_id: str) -> None: ...

    def list_agents(self) -> list[str]: ...


@runtime_checkable
class AsyncMemoryStorage(Protocol):
    async def save_memory(self, agent_id: str, memory: AgentMemory) -> None: ...

    async def load_memory(self, agent_id: str) -> AgentMemory | None: ...

    async def delete_memory(self, agent_id: str) -> None: ...

    async def list_agents(self) -> list[str]: ...


class HiddenChannel(BaseModel):
    """Container for hidden state and embedding tensors with metadata."""

    model_config = ConfigDict(arbitrary_types_allowed=True)

    hidden_state: torch.Tensor | None = None
    embedding: torch.Tensor | None = None
    metadata: dict[str, Any] = Field(default_factory=dict)

    def to_dict(self) -> dict[str, Any]:
        """Serialize the hidden channel to a dictionary."""
        return {
            "hidden_state": (self.hidden_state.cpu().tolist() if self.hidden_state is not None else None),
            "embedding": (self.embedding.cpu().tolist() if self.embedding is not None else None),
            "metadata": self.metadata,
        }

    @classmethod
    def from_dict(cls, data: dict[str, Any]) -> "HiddenChannel":
        """Restore a HiddenChannel from a dictionary."""
        return cls(
            hidden_state=(torch.tensor(data["hidden_state"]) if data.get("hidden_state") else None),
            embedding=(torch.tensor(data["embedding"]) if data.get("embedding") else None),
            metadata=data.get("metadata", {}),
        )


class Message(BaseModel):
    """Message with a visible content part and an optional hidden channel."""

    sender_id: str
    receiver_id: str | None
    content: str
    role: str = "assistant"
    timestamp: float = Field(default_factory=time.time)
    hidden: HiddenChannel | None = None
    message_type: str = "response"
    priority: int = 0
    tags: set[str] = Field(default_factory=set)

    @property
    def has_hidden(self) -> bool:
        """True if the message carries a hidden state or embedding."""
        return self.hidden is not None and (self.hidden.hidden_state is not None or self.hidden.embedding is not None)

    def to_visible_dict(self) -> dict[str, Any]:
        """Return only the visible part of the message (role/content/sender)."""
        return {
            "role": self.role,
            "content": self.content,
            "sender": self.sender_id,
        }

    def to_full_dict(self) -> dict[str, Any]:
        """Full message representation including metadata and hidden channel."""
        result = self.to_visible_dict()
        result["timestamp"] = self.timestamp
        result["message_type"] = self.message_type
        result["priority"] = self.priority
        result["tags"] = list(self.tags)
        if self.hidden:
            result["hidden"] = self.hidden.to_dict()
        return result


class MessageProtocol:
    """Message protocol: creates messages and combines hidden states."""

    def __init__(
        self,
        *,
        enable_hidden: bool = True,
        hidden_dim: int | None = None,
        combine_hidden: Callable[[list[torch.Tensor]], torch.Tensor] | None = None,
    ):
        self.enable_hidden = enable_hidden
        self.hidden_dim = hidden_dim
        self.combine_hidden = combine_hidden or self._default_combine

    @staticmethod
    def _default_combine(tensors: list[torch.Tensor]) -> torch.Tensor:
        """Average hidden tensors — default implementation."""
        if not tensors:
            msg = "No tensors to combine"
            raise ValueError(msg)
        stacked = torch.stack(tensors)
        return stacked.mean(dim=0)

    def create_message(
        self,
        sender_id: str,
        content: str,
        receiver_id: str | None = None,
        hidden_state: torch.Tensor | None = None,
        embedding: torch.Tensor | None = None,
        **kwargs,
    ) -> Message:
        """Create a Message, optionally packaging hidden data."""
        hidden = None
        if self.enable_hidden and (hidden_state is not None or embedding is not None):
            hidden = HiddenChannel(
                hidden_state=hidden_state,
                embedding=embedding,
            )

        return Message(
            sender_id=sender_id,
            receiver_id=receiver_id,
            content=content,
            hidden=hidden,
            **kwargs,
        )

    def extract_hidden_states(
        self,
        messages: list[Message],
    ) -> list[torch.Tensor]:
        """Extract a list of hidden states from messages."""
        return [msg.hidden.hidden_state for msg in messages if msg.hidden and msg.hidden.hidden_state is not None]

    def combine_incoming_hidden(
        self,
        messages: list[Message],
    ) -> torch.Tensor | None:
        """Combine hidden states from incoming messages."""
        states = self.extract_hidden_states(messages)
        if not states:
            return None
        return self.combine_hidden(states)

    def format_visible(
        self,
        messages: list[Message],
        agent_names: dict[str, str] | None = None,
    ) -> str:
        """Format the visible parts of messages for a prompt."""
        parts = []
        for msg in messages:
            name = (agent_names or {}).get(msg.sender_id, msg.sender_id)
            parts.append(f"[{name}]:\n{msg.content}")
        return "\n\n".join(parts)