MnemoCore / docs /AGI_MEMORY_BLUEPRINT.md

Upload folder using huggingface_hub

c3a3710 verified about 1 month ago

21.4 kB

	# MnemoCore AGI Memory Blueprint
	### Toward a True Cognitive Memory Substrate for Agentic Systems

	> This document defines the Phase 5 “AGI Memory” architecture for MnemoCore – transforming it from a high‑end hyperdimensional memory engine into a general cognitive substrate for autonomous AI agents.

	---

	## 0. Goals & Non‑Goals

	### 0.1 Core Goals

	- Provide a plug‑and‑play cognitive memory system that any agent framework can mount as its “mind”:
	- Solves context window limits by offloading long‑term structure and recall.
	- Solves memory management by autonomous consolidation, forgetting, and self‑repair.
	- Provides new thoughts, associations and suggestions rather than only retrieval.
	- Implement an explicit, formal model of:
	- Working / Short‑Term Memory (WM/STM)
	- Episodic Memory
	- Semantic Memory
	- Procedural / Skill Memory
	- Meta‑Memory & Self‑Model
	- Maintain:
	- `pip install mnemocore` zero‑infra dev mode (SQLite / in‑process vector store).
	- Full infra path (Redis, Qdrant, k8s, MCP, OpenClaw live memory integration).[cite:436][cite:437]
	- Provide clean public APIs (Python + HTTP + MCP) that:
	- Give agents a minimal but powerful surface: `observe / recall / reflect / propose_change`.
	- Are stable enough to build higher‑level frameworks on (LangGraph, AutoGen, OpenAI Agents, OpenClaw, custom stacks).

	### 0.2 Non‑Goals

	- MnemoCore is not:
	- En LLM eller policy‑generator.
	- En komplett agentram – det är minnet + kognitiva processer.
	- MnemoCore ska inte hårdkoda specifika LLM‑providers.
	- LLM används via abstraherad integration (`SubconsciousAI`, `LLMIntegration`) så att byte av motor är trivialt.

	---

	## 1. Cognitive Architecture Overview

	### 1.1 High‑Level Mental Model

	Systemet ska exponera en internt konsekvent kognitiv modell:

	- Working Memory (WM)
	- Korttidsbuffert per agent / samtal / uppgift.
	- Håller aktuella mål, senaste steg, delresultat.
	- Living in RAM, med explicit API.

	- Episodic Memory (EM)
	- Sekvens av episodes: “agent X gjorde Y i kontext Z och fick utfallet U”.
	- Tidsstämplad, med länkar mellan episoder (kedjor).
	- Riktad mot “vad hände när, i vilken ordning”.

	- Semantic Memory (SM)
	- Abstraherade, konsoliderade representationer (concepts, prototypes).
	- Sammanfattningar av hundratals episoder → en “semantic anchor”.
	- Bra för svar på “vad vet jag generellt om X?”.

	- Procedural Memory (PM)
	- Skills, planer, recept: “för att lösa typ‑X problem, gör följande steg …”.
	- Kan hålla både mänsklig läsbar text och exekverbar kod (snippets, tools).

	- Meta‑Memory (MM)
	- Självmodell för MnemoCore själv: prestanda, reliability, konfiguration, kända svagheter.
	- Driver självförbättringsloopen.

	Alla dessa lever ovanpå din befintliga HDV/VSA‑kärna, tier manager, synapse index, subconscious loop osv.[cite:436][cite:437]

	### 1.2 New Core Services

	Föreslagna nya Python‑moduler (under `src/mnemocore/core`):

	- `memory_model.py`
	- Typed dataklasser för WM/EM/SM/PM/MM entities.
	- `working_memory.py`
	- WM implementation per agent/task med snabb caching.
	- `episodic_store.py`
	- Episodisk tidsserie, sekvens‑API.
	- `semantic_store.py`
	- Wrapper ovanpå befintlig vektorstore (Qdrant/HDV/HNSW) + consolidation hooks.
	- `procedural_store.py`
	- Lagret för skills, scripts, tool definitions.
	- `meta_memory.py`
	- Självmodell, logik för self‑improvement proposals.
	- `pulse.py`
	- “Heartbeat”‑loop: driver subtle thoughts, consolidation ticks, gap detection, self‑reflection.
	- `agent_profile.py`
	- Persistent profil per agent: preferenser, styrkor/svagheter, quirks.

	---

	## 2. Data Model

	### 2.1 Working Memory (WM)

	```python
	# src/mnemocore/core/memory_model.py

	@dataclass
	class WorkingMemoryItem:
	id: str
	agent_id: str
	created_at: datetime
	ttl_seconds: int
	content: str
	kind: Literal["thought", "observation", "goal", "plan_step", "meta"]
	importance: float #
	tags: list[str]
	hdv: BinaryHDV \| None

	@dataclass
	class WorkingMemoryState:
	agent_id: str
	items: list[WorkingMemoryItem]
	max_items: int
	```

	Invariantes:

	- WM är liten (t.ex. 32–128 items per agent).
	- WM ligger primärt i RAM; kan serialiseras till Redis/SQLite för persistens.
	- Access är O(1)/O(log n); LRU + importance‑vägning vid evicering.

	### 2.2 Episodic Memory (EM)

	```python
	@dataclass
	class EpisodeEvent:
	timestamp: datetime
	kind: Literal["observation", "action", "thought", "reward", "error"]
	content: str
	metadata: dict[str, Any]
	hdv: BinaryHDV

	@dataclass
	class Episode:
	id: str
	agent_id: str
	started_at: datetime
	ended_at: datetime \| None
	goal: str \| None
	context: str \| None # project / environment
	events: list[EpisodeEvent]
	outcome: Literal["success", "failure", "partial", "unknown"]
	reward: float \| None
	links_prev: list[str] # previous episode IDs
	links_next: list[str] # next episode IDs
	ltp_strength: float
	reliability: float
	```

	### 2.3 Semantic Memory (SM)

	```python
	@dataclass
	class SemanticConcept:
	id: str
	label: str # "fastapi-request-validation"
	description: str
	tags: list[str]
	prototype_hdv: BinaryHDV
	support_episode_ids: list[str] # episodes som gav upphov
	reliability: float
	last_updated_at: datetime
	metadata: dict[str, Any]
	```

	Kopplas direkt mot consolidation/semantic_consolidation + codebook/immunology.[cite:436][cite:437]

	### 2.4 Procedural Memory (PM)

	```python
	@dataclass
	class ProcedureStep:
	order: int
	instruction: str
	code_snippet: str \| None
	tool_call: dict[str, Any] \| None

	@dataclass
	class Procedure:
	id: str
	name: str
	description: str
	created_by_agent: str \| None
	created_at: datetime
	updated_at: datetime
	steps: list[ProcedureStep]
	trigger_pattern: str # "if user asks about X and Y"
	success_count: int
	failure_count: int
	reliability: float
	tags: list[str]
	```

	Procedurer kan genereras av LLM (SubconsciousAI), testas i episodiskt minne, och sedan promotas/demotas med reliability‑loop.

	### 2.5 Meta‑Memory (MM)

	```python
	@dataclass
	class SelfMetric:
	name: str # "hot_tier_hit_rate", "avg_query_latency_ms"
	value: float
	window: str # "5m", "1h", "24h"
	updated_at: datetime

	@dataclass
	class SelfImprovementProposal:
	id: str
	created_at: datetime
	author: Literal["system", "agent", "human"]
	title: str
	description: str
	rationale: str
	expected_effect: str
	status: Literal["pending", "accepted", "rejected", "implemented"]
	metadata: dict[str, Any]
	```

	MM lagras delvis i vanlig storage (SM/PM) men har egen API‑yta.

	---

	## 3. Service Layer Design

	### 3.1 Working Memory Service

	Fil: `src/mnemocore/core/working_memory.py`

	Ansvar:

	- Hålla en per‑agent WM‑state.
	- Explicita operationer:
	- `push_item(agent_id, item: WorkingMemoryItem)`
	- `get_state(agent_id) -> WorkingMemoryState`
	- `clear(agent_id)`
	- `prune(agent_id)` – enligt importance + LRU.
	- Integrera med engine/query:
	- Vid varje query: WM får en snapshot av top‑K resultat som “context items”.
	- Vid svar: agent kan markera vilka items som var relevanta.

	### 3.2 Episodic Store Service

	Fil: `src/mnemocore/core/episodic_store.py`

	Ansvar:

	- Skapa och uppdatera Episodes:
	- `start_episode(agent_id, goal, context) -> episode_id`
	- `append_event(episode_id, kind, content, metadata)`
	- `end_episode(episode_id, outcome, reward)`
	- Query:
	- `get_episode(id)`
	- `get_recent(agent_id, limit, context)`
	- `find_similar_episodes(hdv, top_k)`
	- Koppling till befintlig HDV + tier manager:
	- Varje Episode får en “episode_hdv” (bundle över event‑HDVs).
	- LTP + reliabilitet följer samma formel som övrig LTP.

	### 3.3 Semantic Store Service

	Fil: `src/mnemocore/core/semantic_store.py`

	Ansvar:

	- Hålla SemanticConcepts + codebook.
	- API:
	- `upsert_concept(concept: SemanticConcept)`
	- `find_nearby_concepts(hdv, top_k)`
	- `get_concept(id)`
	- Hookar mot:
	- `semantic_consolidation.py` → abstraktioner / anchors.
	- `immunology.py` → attractor cleanup.
	- `recursive_synthesizer.py` → djup konceptsyntes.

	### 3.4 Procedural Store Service

	Fil: `src/mnemocore/core/procedural_store.py`

	Ansvar:

	- Lagra och hämta Procedures.
	- API:
	- `store_procedure(proc: Procedure)`
	- `get_procedure(id)`
	- `find_applicable_procedures(query, agent_id)`
	- `record_procedure_outcome(id, success: bool)`
	- Integrera med:
	- SubconsciousAI → generera nya procedurer från pattern i EM/SM.
	- Reliability‑loopen → promota “verified” skills.

	### 3.5 Meta Memory Service

	Fil: `src/mnemocore/core/meta_memory.py`

	Ansvar:

	- Hålla SelfMetrics + SelfImprovementProposals.
	- API:
	- `record_metric(metric: SelfMetric)`
	- `list_metrics(filter...)`
	- `create_proposal(...)`
	- `update_proposal_status(id, status)`
	- Integrera med:
	- Pulse → skanna metrics och föreslå ändringar.
	- LLM → generera förslagstexter (“self‑reflection reports”).

	---

	## 4. Pulse & Subtle Thoughts

	### 4.1 Pulse Definition

	Fil: `src/mnemocore/core/pulse.py`

	“Pulsen” är en central loop (async task, cron, eller k8s CronJob) som:

	- Kör med konfigurerbart intervall (t.ex. var 10:e sekund–var 5:e minut).
	- Har ett definierat set “ticks”:

	```python
	class PulseTick(Enum):
	WM_MAINTENANCE = "wm_maintenance"
	EPISODIC_CHAINING = "episodic_chaining"
	SEMANTIC_REFRESH = "semantic_refresh"
	GAP_DETECTION = "gap_detection"
	INSIGHT_GENERATION = "insight_generation"
	PROCEDURE_REFINEMENT = "procedure_refinement"
	META_SELF_REFLECTION = "meta_self_reflection"
	```

	Pulse orchestrerar:

	- WM_MAINTENANCE
	- Prune WM per agent.
	- Lyfta nyligen viktiga items (“keep in focus”).

	- EPISODIC_CHAINING
	- Skapa/länka episodiska sekvenser (prev/next).
	- “Temporala narrativ”.

	- SEMANTIC_REFRESH
	- Uppdatera semantic concepts baserat på nya episoder.
	- Trigga immunology cleanup för drift.

	- GAP_DETECTION
	- Kör `GapDetector` över EM/SM sista N minuter/timmar.
	- Producera strukturerade knowledge gaps.

	- INSIGHT_GENERATION
	- Kör SubconsciousAI/LLM över utvalda kluster.
	- Skapar nya SemanticConcepts, Procedures, eller MetaProposals.

	- PROCEDURE_REFINEMENT
	- Uppdatera reliability över PM.
	- Flagga outdated/farliga procedures.

	- META_SELF_REFLECTION
	- Sammanfattar senaste metriker, gap, failures → SelfImprovementProposals.

	### 4.2 Pulse Implementation Sketch

	```python
	# src/mnemocore/core/pulse.py

	class Pulse:
	def __init__(self, container, config):
	self.container = container
	self.config = config
	self._running = False

	async def start(self):
	self._running = True
	while self._running:
	start = datetime.utcnow()
	await self.tick()
	elapsed = (datetime.utcnow() - start).total_seconds()
	await asyncio.sleep(max(0, self.config.pulse_interval_seconds - elapsed))

	async def tick(self):
	await self._wm_maintenance()
	await self._episodic_chaining()
	await self._semantic_refresh()
	await self._gap_detection()
	await self._insight_generation()
	await self._procedure_refinement()
	await self._meta_self_reflection()
	```

	Konfiguration i `config.yaml`:

	```yaml
	haim:
	pulse:
	enabled: true
	interval_seconds: 30
	max_agents_per_tick: 50
	max_episodes_per_tick: 200
	```

	---

	## 5. Agent‑Facing APIs (Python & HTTP & MCP)

	### 5.1 High‑Level Python API

	Fil: `src/mnemocore/agent_interface.py`

	Syfte: ge agent‑kod ett ENKELT API:

	```python
	class CognitiveMemoryClient:
	def __init__(self, engine: HAIMEngine, wm, episodic, semantic, procedural, meta):
	...

	# --- Observation & WM ---
	def observe(self, agent_id: str, content: str, **meta) -> str: ...
	def get_working_context(self, agent_id: str, limit: int = 16) -> list[WorkingMemoryItem]: ...

	# --- Episodic ---
	def start_episode(self, agent_id: str, goal: str, context: str \| None = None) -> str: ...
	def append_event(self, episode_id: str, kind: str, content: str, **meta) -> None: ...
	def end_episode(self, episode_id: str, outcome: str, reward: float \| None = None) -> None: ...

	# --- Semantic / Retrieval ---
	def recall(self, agent_id: str, query: str, context: str \| None = None,
	top_k: int = 8, modes: tuple[str, ...] = ("episodic","semantic")) -> list[dict]: ...

	# --- Procedural ---
	def suggest_procedures(self, agent_id: str, query: str, top_k: int = 5) -> list[Procedure]: ...
	def record_procedure_outcome(self, proc_id: str, success: bool) -> None: ...

	# --- Meta / Self-awareness ---
	def get_knowledge_gaps(self, agent_id: str, lookback_hours: int = 24) -> list[dict]: ...
	def get_self_improvement_proposals(self) -> list[SelfImprovementProposal]: ...
	```

	### 5.2 HTTP Layer Additions

	Utöver befintliga `/store`, `/query`, `/feedback`, osv.[cite:437]

	Nya endpoints:

	- `POST /wm/observe`
	- `GET /wm/{agent_id}`
	- `POST /episodes/start`
	- `POST /episodes/{id}/event`
	- `POST /episodes/{id}/end`
	- `GET /episodes/{id}`
	- `GET /agents/{agent_id}/episodes`
	- `GET /agents/{agent_id}/context`
	- `GET /agents/{agent_id}/knowledge-gaps`
	- `GET /procedures/search`
	- `POST /procedures/{id}/feedback`
	- `GET /meta/proposals`
	- `POST /meta/proposals`

	### 5.3 MCP Tools

	Utöka `mnemocore.mcp.server` med nya verktyg:

	- `store_observation`
	- `recall_context`
	- `start_episode`, `end_episode`
	- `query_memory`
	- `get_knowledge_gaps`
	- `get_self_improvement_proposals`

	Så att Claude/GPT‑agenter kan:

	- “Titta in” i agentens egen historik.
	- Få WM + relevanta episoder + semantic concepts innan svar.
	- Få gaps och self‑reflection prompts.

	---

	## 6. Self‑Improvement Loop

	### 6.1 Loop Definition

	Målet: MnemoCore ska ständigt förbättra sig:

	1. Samlar metrics (performance + quality).
	2. Upptäcker systematiska brister (höga felrates, gap‑clusters).
	3. Genererar SelfImprovementProposals via LLM.
	4. Låter människa eller meta‑agent granska & appliera.

	### 6.2 Pipeline

	1. Metrics Collection
	- Utnyttja befintlig `metrics.py` + Prometheus.[cite:436][cite:437]
	- Exempelmetriker:
	- `query_hit_rate`, `retrieval_latency_ms`
	- `feedback_success_rate`, `feedback_failure_rate`
	- `hot_tier_size`, `tier_promotion_rate`
	- `gap_detection_count`, `gap_fill_count`

	2. Issue Detection (Rule‑Based)
	- Batchjobb (Pulse) kör enkla regler:
	- Om `feedback_failure_rate > X` för en viss tag (t.ex. “fastapi”) → skapa “knowledge area weak” flagg.
	- Om `hot_tier_hit_rate < threshold` → dålig context‑masking eller fel tuned thresholds.

	3. Proposal Generation (LLM)
	- `SubconsciousAI` får inputs:
	- Metrics, knowledge gaps, failure cases, config snapshot.
	- Prompt genererar:
	- `SelfImprovementProposal.title/description/rationale`.

	4. Review & Execution
	- API / UI för att lista proposals.
	- Människa/agent accepterar/rejectar.
	- Vid accept:
	- Kan trigga config ändringar (med patch PR).
	- Kan skapa GitHub issues/PR mallar.

	### 6.3 API

	- `GET /meta/proposals`
	- `POST /meta/proposals/{id}/status`

	---

	## 7. Association & “Subtle Thoughts”

	### 7.1 Association Engine

	Målet: Systemet ska själv föreslå:

	- Analogier (“det här liknar när vi gjorde X i annat projekt”).
	- Relaterade koncept (“du pratar om Y, men Z har varit viktigt tidigare”).
	- Långsiktiga teman och lärdomar.

	Bygg vidare på:

	- `synapse_index.py` (hebbian connections).[cite:436]
	- `ripple_context.py` (kaskader).[cite:436]
	- `recursive_synthesizer.py` (konceptsyntes).[cite:436]

	Nya pattern:

	- Vid varje Pulse:
	- Hämta senaste N episoder.
	- Kör k‑NN i semantic concept space.
	- Kör ripple over synapses.
	- Generera en uppsättning CandidateAssociations:

	```python
	@dataclass
	class CandidateAssociation:
	id: str
	agent_id: str
	created_at: datetime
	source_episode_ids: list[str]
	related_concept_ids: list[str]
	suggestion_text: str
	confidence: float
	```

	Lagra i SM/EM så att agent/LLM kan hämta “subtle thoughts” innan svar:

	- `GET /agents/{agent_id}/subtle-thoughts`

	---

	## 8. Storage Backends & Profiles

	### 8.1 Profiles

	Behåll pip‑enkelheten via profiler:

	- Lite Profile (default, no extra deps):
	- WM: in‑process dict
	- EM: SQLite
	- SM: in‑process HDV + mmap
	- PM/MM: SQLite/JSON
	- Standard Profile:
	- WARM: Redis
	- COLD: filesystem
	- Scale Profile:
	- WARM: Redis
	- COLD: Qdrant (eller annan vector DB)
	- Optionellt: S3 archive

	Konfigurationsexempel:

	```yaml
	haim:
	profile: "lite" # "lite" \| "standard" \| "scale"
	```

	---

	## 9. OpenClaw & External Agents

	### 9.1 Designprincip för integration

	För OpenClaw / liknande orchestrators:

	- En agent definieras genom:
	- `agent_id`
	- `capabilities` (tools etc.)
	- MnemoCore ska behandla `agent_id` som primär nyckel för:
	- WM
	- Episoder
	- Preferenser
	- Procedurer som agenten själv skapat

	### 9.2 “Live Memory” Pattern

	- När OpenClaw kör:
	- Varje observation → `observe(agent_id, content, meta)`
	- Varje tool call / action → episod event.
	- Före varje beslut:
	- Hämta:
	- `WM`
	- `recent episodes`
	- `relevant semantic concepts`
	- `subtle thoughts` / associations
	- `knowledge gaps` (om agenten vill använda dessa som frågor).

	---

	## 10. Testing & Evaluation Plan

	### 10.1 Unit & Integration Tests

	Nya testfiler:

	- `tests/test_working_memory.py`
	- `tests/test_episodic_store.py`
	- `tests/test_semantic_store.py`
	- `tests/test_procedural_store.py`
	- `tests/test_meta_memory.py`
	- `tests/test_pulse.py`
	- `tests/test_agent_interface.py`

	Fokus:

	- Invariantes (max WM size, LTP thresholds, reliability‑update).
	- Episodic chaining korrekt.
	- Semantic consolidation integration med nya SM‑API:t.
	- Pulse tick ordering & time budget.

	### 10.2 Behavioural Benchmarks

	Skapa `benchmarks/AGI_MEMORY_SCENARIOS.md`:

	- Multi‑session tasks där agent måste:
	- Minnas user preferences över dagar.
	- Lära sig av failed attempts (feedback).
	- Använda analogier över domäner.

	Mät:

	- Context reuse rate.
	- Time‑to‑solve vs “no memory” baseline.
	- Antal genererade self‑improvement proposals som faktiskt förbättrar outcomes.

	---

	## 11. Implementation Roadmap

	### Phase 5.0 – Core Structure

	1. Introduce `memory_model.py`, `working_memory.py`, `episodic_store.py`, `semantic_store.py`, `procedural_store.py`, `meta_memory.py`, `pulse.py`.
	2. Wire everything in `container.py` (new providers).
	3. Add `CognitiveMemoryClient` + minimal tests.

	### Phase 5.1 – WM/EM/SM in Engine

	4. Integrate WM into engine query/store paths.
	5. Integrate EM creation in API (store/query/feedback).
	6. Adapt semantic_consolidation/immunology to new SM service.

	### Phase 5.2 – Procedural & Association

	7. Implement procedural store + reliability integration.
	8. Build association engine + subtle thoughts endpoints.

	### Phase 5.3 – Self‑Improvement

	9. Wire metrics → meta_memory → proposals via SubconsciousAI.
	10. Add endpoints & optional small UI for proposals.

	### Phase 5.4 – Hardening & Agents

	11. Harden profiles (lite/standard/scale).
	12. Build reference integrations (OpenClaw, LangGraph, AutoGen).

	---

	## 12. Developer Notes

	- Håll backwards compatibility på API där det går:
	- Nya endpoints → prefix `v2` om nödvändigt.
	- Python API kan vara “ny high‑level layer” ovanpå befintlig `HAIMEngine`.
	- All ny funktionalitet feature‑flaggas i config:
	- `haim.pulse.enabled`
	- `haim.episodic.enabled`
	- `haim.procedural.enabled`
	- etc.
	- Strikt logging / metrics för allt nytt:
	- `haim_pulse_tick_duration_seconds`
	- `haim_wm_size`
	- `haim_episode_count`
	- `haim_procedure_success_rate`
	- `haim_self_proposals_pending`

	---

	This blueprint is the contract between MnemoCore, its agents, and its contributors. The intention is to let autonomous AI agents, human developers, and MnemoCore itself co‑evolve toward a truly cognitive memory substrate – one that remembers, forgets, reflects, and grows.