Spaces:

Executor-Tyrant-Framework
/

Condensate

Sleeping

App Files Files Community

Condensate / condenser.py

Executor-Tyrant-Framework

Condensate PoC — all 4 layers + HF Spaces demo

262b9d5 about 2 months ago

raw

history blame contribute delete

19.4 kB

	"""
	Condensate Layer 3: The Condenser

	The actual RAM reduction engine. Takes predictions from Layer 2
	and manages memory tiers:

	HOT: Full Python objects in RAM (actively accessed)
	WARM: LZ4-compressed binary in RAM (predicted-soon or recently cold)
	COLD: Serialized to disk (not predicted, not recent)

	When the predictor says "region B is coming," the condenser
	pre-promotes B from WARM→HOT before the access arrives.
	When a region goes quiet, the condenser demotes it HOT→WARM→COLD.

	This is the layer that proves RAM savings are real and measurable.

	Usage:
	from condenser import Condenser

	condenser = Condenser(ram_budget_mb=50)
	condenser.learn_and_manage(state_dict, workload_fn)
	condenser.print_results()
	"""

	import numpy as np
	import pickle
	import lz4.frame
	import time
	import sys
	import os
	import tempfile
	from collections import defaultdict

	sys.path.insert(0, os.path.dirname(__file__))
	from membrane import Membrane
	from graph_builder import GraphBuilder
	from predictor import Predictor


	class MemoryRegion:
	"""A managed memory region with tier tracking."""

	__slots__ = ['path', 'tier', 'hot_data', 'warm_data', 'cold_path',
	'original_size', 'compressed_size', 'access_count',
	'last_access_ns', 'promotions', 'demotions',
	'prediction_hits']

	def __init__(self, path, data):
	self.path = path
	self.tier = "HOT"
	self.hot_data = data
	self.warm_data = None # LZ4 compressed bytes
	self.cold_path = None # disk file path
	self.original_size = self._measure(data)
	self.compressed_size = 0
	self.access_count = 0
	self.last_access_ns = time.monotonic_ns()
	self.promotions = 0
	self.demotions = 0
	self.prediction_hits = 0

	def _measure(self, data):
	"""Measure actual memory footprint."""
	if isinstance(data, np.ndarray):
	return data.nbytes
	elif isinstance(data, (bytes, bytearray)):
	return len(data)
	else:
	try:
	return sys.getsizeof(data)
	except TypeError:
	return 64 # fallback estimate

	def compress_to_warm(self):
	"""HOT → WARM: compress data, free the original."""
	if self.tier != "HOT" or self.hot_data is None:
	return 0

	serialized = pickle.dumps(self.hot_data, protocol=pickle.HIGHEST_PROTOCOL)
	self.warm_data = lz4.frame.compress(serialized)
	self.compressed_size = len(self.warm_data)

	saved = self.original_size - self.compressed_size
	self.hot_data = None
	self.tier = "WARM"
	self.demotions += 1
	return max(saved, 0)

	def compress_to_cold(self, cold_dir):
	"""WARM → COLD: write to disk, free RAM entirely."""
	if self.tier == "COLD":
	return 0

	# If still HOT, compress first
	if self.tier == "HOT":
	self.compress_to_warm()

	if self.warm_data is None:
	return 0

	# Write compressed data to disk
	safe_name = self.path.replace(".", "_").replace("/", "_")
	self.cold_path = os.path.join(cold_dir, f"{safe_name}.cold")
	with open(self.cold_path, 'wb') as f:
	f.write(self.warm_data)

	saved = self.compressed_size
	self.warm_data = None
	self.compressed_size = 0
	self.tier = "COLD"
	self.demotions += 1
	return saved

	def promote_to_hot(self):
	"""WARM/COLD → HOT: decompress and restore."""
	if self.tier == "HOT":
	return self.hot_data

	if self.tier == "COLD" and self.cold_path:
	# Load from disk first
	with open(self.cold_path, 'rb') as f:
	self.warm_data = f.read()
	self.compressed_size = len(self.warm_data)
	self.tier = "WARM"

	if self.tier == "WARM" and self.warm_data:
	decompressed = lz4.frame.decompress(self.warm_data)
	self.hot_data = pickle.loads(decompressed)
	self.warm_data = None
	self.compressed_size = 0
	self.tier = "HOT"
	self.promotions += 1

	return self.hot_data

	@property
	def current_ram_usage(self):
	"""How much RAM this region currently uses."""
	if self.tier == "HOT":
	return self.original_size
	elif self.tier == "WARM":
	return self.compressed_size
	else:
	return 0 # on disk

	def touch(self):
	"""Record an access."""
	self.access_count += 1
	self.last_access_ns = time.monotonic_ns()


	class Condenser:
	"""The RAM condensation engine.

	Manages memory regions across HOT/WARM/COLD tiers using
	predictions from the Layer 2 predictor to pre-stage data.
	"""

	def __init__(self, ram_budget_mb=None, cold_dir=None,
	demotion_idle_ms=50, warmup_iters=10):
	"""
	Args:
	ram_budget_mb: Max RAM budget in MB. None = no limit (measure only).
	cold_dir: Directory for cold storage. None = auto temp dir.
	demotion_idle_ms: Demote to WARM after this many ms idle.
	warmup_iters: Number of iterations to observe before condensing.
	"""
	self.ram_budget_bytes = int(ram_budget_mb * 1024 * 1024) if ram_budget_mb else None
	self.cold_dir = cold_dir or tempfile.mkdtemp(prefix="condensate_cold_")
	self.demotion_idle_ms = demotion_idle_ms
	self.warmup_iters = warmup_iters

	self.regions = {} # path → MemoryRegion
	self.predictor = None
	self.graph = None

	# Metrics
	self.metrics = {
	"peak_ram_no_condensate": 0,
	"peak_ram_with_condensate": 0,
	"total_promotions": 0,
	"total_demotions": 0,
	"prediction_driven_promotions": 0,
	"reactive_promotions": 0,
	"total_ram_saved_bytes": 0,
	"access_latencies_ns": [],
	"cold_accesses_avoided": 0,
	"cold_accesses_hit": 0,
	}

	def register(self, path, data):
	"""Register a memory region for management."""
	self.regions[path] = MemoryRegion(path, data)

	def _current_ram(self):
	"""Total current RAM usage across all regions."""
	return sum(r.current_ram_usage for r in self.regions.values())

	def _demote_coldest(self, target_savings):
	"""Demote regions to meet RAM budget. Coldest first."""
	now = time.monotonic_ns()
	saved = 0

	# Sort by last access time (oldest first)
	candidates = sorted(
	[r for r in self.regions.values() if r.tier == "HOT"],
	key=lambda r: r.last_access_ns
	)

	for region in candidates:
	if saved >= target_savings:
	break

	idle_ms = (now - region.last_access_ns) / 1_000_000
	if idle_ms < self.demotion_idle_ms * 0.5:
	continue # too recently accessed

	saved += region.compress_to_warm()
	self.metrics["total_demotions"] += 1

	# If still over budget, push WARM to COLD
	if saved < target_savings:
	warm_candidates = sorted(
	[r for r in self.regions.values() if r.tier == "WARM"],
	key=lambda r: r.last_access_ns
	)
	for region in warm_candidates:
	if saved >= target_savings:
	break
	saved += region.compress_to_cold(self.cold_dir)
	self.metrics["total_demotions"] += 1

	return saved

	def _enforce_budget(self):
	"""Enforce RAM budget by demoting as needed."""
	if self.ram_budget_bytes is None:
	return

	current = self._current_ram()
	if current > self.ram_budget_bytes:
	overage = current - self.ram_budget_bytes
	self._demote_coldest(overage)

	def _periodic_demotion(self):
	"""Demote idle regions even without budget pressure."""
	now = time.monotonic_ns()

	for region in self.regions.values():
	if region.tier == "HOT":
	idle_ms = (now - region.last_access_ns) / 1_000_000
	if idle_ms > self.demotion_idle_ms:
	region.compress_to_warm()
	self.metrics["total_demotions"] += 1
	elif region.tier == "WARM":
	# Push long-idle WARM to COLD (disk) for real RAM savings
	idle_ms = (now - region.last_access_ns) / 1_000_000
	if idle_ms > self.demotion_idle_ms * 3:
	region.compress_to_cold(self.cold_dir)
	self.metrics["total_demotions"] += 1

	def access(self, path):
	"""Access a region — promote if needed, record latency.

	Returns the data.
	"""
	region = self.regions.get(path)
	if region is None:
	return None

	start = time.monotonic_ns()

	if region.tier != "HOT":
	# Need to promote — was this predicted?
	region.promote_to_hot()
	self.metrics["total_promotions"] += 1
	self.metrics["reactive_promotions"] += 1

	if region.tier != "HOT":
	# Still not hot — disk failure?
	return None

	elapsed_ns = time.monotonic_ns() - start
	self.metrics["access_latencies_ns"].append(elapsed_ns)
	region.touch()

	return region.hot_data

	def pre_promote(self, path):
	"""Prediction-driven promotion — pre-stage before access.

	Called by the predictor when it predicts this path will be accessed.
	"""
	region = self.regions.get(path)
	if region is None:
	return

	if region.tier != "HOT":
	region.promote_to_hot()
	self.metrics["total_promotions"] += 1
	self.metrics["prediction_driven_promotions"] += 1
	self.metrics["cold_accesses_avoided"] += 1
	region.prediction_hits += 1

	def run_benchmark(self, state, workload_fn, iterations=20,
	name="benchmark"):
	"""Full benchmark: measure RAM with and without condensation.

	Runs the workload twice:
	1. Baseline: no condensation, measure peak RAM
	2. Condensed: with prediction and tier management

	Args:
	state: dict of name → data (numpy arrays, dicts, etc.)
	workload_fn: function(wrapped_state) that accesses state
	iterations: how many times to run the workload
	name: label for the wrapped state

	Returns:
	dict with benchmark results
	"""
	print(f"\n Phase 1: Baseline measurement ({self.warmup_iters} iters)...")

	# --- BASELINE: No condensation ---
	total_state_size = 0
	for key, value in state.items():
	if isinstance(value, np.ndarray):
	total_state_size += value.nbytes
	elif isinstance(value, dict):
	for v in value.values():
	if isinstance(v, np.ndarray):
	total_state_size += v.nbytes

	baseline_ram = total_state_size
	self.metrics["peak_ram_no_condensate"] = baseline_ram

	# --- LEARN: Run workload with membrane to learn patterns ---
	Membrane.clear()
	wrapped = Membrane.wrap(
	{k: v.copy() if isinstance(v, np.ndarray) else
	{k2: v2.copy() if isinstance(v2, np.ndarray) else v2
	for k2, v2 in v.items()} if isinstance(v, dict) else v
	for k, v in state.items()},
	name
	)

	for _ in range(self.warmup_iters):
	workload_fn(wrapped)

	train_log = Membrane.get_log()

	# Build graph and predictor
	self.graph = GraphBuilder(causal_window_ns=3_000_000)
	self.graph.build(train_log)

	self.predictor = Predictor()
	self.predictor.learn(self.graph)

	# Score prediction accuracy on training data
	pred_result = self.predictor.score(train_log)
	pred_accuracy = pred_result["accuracy"]

	print(f" Prediction accuracy on training data: {pred_accuracy}%")

	# --- CONDENSE: Register all regions, run with tier management ---
	print(f"\n Phase 2: Condensed run ({iterations} iters)...")

	# Register all leaf data as regions
	for key, value in state.items():
	if isinstance(value, np.ndarray):
	self.register(f"{name}.{key}", value.copy())
	elif isinstance(value, dict):
	for k2, v2 in value.items():
	path = f"{name}.{key}.{k2}"
	if isinstance(v2, np.ndarray):
	self.register(path, v2.copy())
	else:
	self.register(path, v2)

	ram_snapshots = []
	promotion_log = []

	for iteration in range(iterations):
	# Periodic demotion of idle regions
	self._periodic_demotion()
	self._enforce_budget()

	# Run workload with condensation
	Membrane.clear()

	# We simulate the workload by tracking which paths get accessed
	# and using the predictor to pre-promote
	wrapped_sim = Membrane.wrap(
	{k: v.copy() if isinstance(v, np.ndarray) else
	{k2: v2.copy() if isinstance(v2, np.ndarray) else v2
	for k2, v2 in v.items()} if isinstance(v, dict) else v
	for k, v in state.items()},
	name
	)

	workload_fn(wrapped_sim)
	iter_log = Membrane.get_log()

	# Process each access: predict → pre-promote → access
	for ts, event_type, path, size_bytes in sorted(iter_log, key=lambda e: e[0]):
	# Get predictions from this access
	predictions = self.predictor.predict(path, top_k=5)

	# Pre-promote predicted regions
	for pred in predictions:
	if pred.confidence >= 0.5:
	self.pre_promote(pred.path)

	# Access the region (may already be HOT from prediction)
	region = self.regions.get(path)
	if region:
	if region.tier == "HOT":
	region.touch()
	else:
	self.access(path)
	self.metrics["cold_accesses_hit"] += 1

	# Snapshot RAM usage
	current_ram = self._current_ram()
	ram_snapshots.append(current_ram)

	hot_count = sum(1 for r in self.regions.values() if r.tier == "HOT")
	warm_count = sum(1 for r in self.regions.values() if r.tier == "WARM")
	cold_count = sum(1 for r in self.regions.values() if r.tier == "COLD")

	promotion_log.append({
	"iter": iteration,
	"ram_bytes": current_ram,
	"hot": hot_count,
	"warm": warm_count,
	"cold": cold_count,
	})

	# Final metrics
	min_ram = min(ram_snapshots) if ram_snapshots else baseline_ram
	avg_ram = np.mean(ram_snapshots) if ram_snapshots else baseline_ram
	self.metrics["peak_ram_with_condensate"] = max(ram_snapshots) if ram_snapshots else baseline_ram

	saved_bytes = baseline_ram - avg_ram
	saved_pct = (saved_bytes / baseline_ram * 100) if baseline_ram > 0 else 0
	self.metrics["total_ram_saved_bytes"] = int(saved_bytes)

	return {
	"baseline_ram_mb": baseline_ram / (1024 * 1024),
	"avg_condensed_ram_mb": avg_ram / (1024 * 1024),
	"min_condensed_ram_mb": min_ram / (1024 * 1024),
	"peak_condensed_ram_mb": self.metrics["peak_ram_with_condensate"] / (1024 * 1024),
	"saved_mb": saved_bytes / (1024 * 1024),
	"saved_pct": saved_pct,
	"prediction_accuracy": pred_accuracy,
	"prediction_promotions": self.metrics["prediction_driven_promotions"],
	"reactive_promotions": self.metrics["reactive_promotions"],
	"cold_accesses_avoided": self.metrics["cold_accesses_avoided"],
	"total_regions": len(self.regions),
	"ram_snapshots": ram_snapshots,
	"promotion_log": promotion_log,
	}

	def print_results(self, results):
	"""Print benchmark results."""
	print(f"\n{'='*60}")
	print(f" CONDENSATE — Layer 3 Benchmark Results")
	print(f"{'='*60}")

	print(f"\n RAM Usage:")
	print(f" Baseline (no condensation): {results['baseline_ram_mb']:>8.2f} MB")
	print(f" Average condensed: {results['avg_condensed_ram_mb']:>8.2f} MB")
	print(f" Minimum condensed: {results['min_condensed_ram_mb']:>8.2f} MB")
	print(f" Peak condensed: {results['peak_condensed_ram_mb']:>8.2f} MB")
	print(f"")
	print(f" * RAM SAVED: {results['saved_mb']:.2f} MB ({results['saved_pct']:.1f}%) *")

	print(f"\n Prediction Performance:")
	print(f" Accuracy: {results['prediction_accuracy']}%")
	print(f" Pre-staged (predicted): {results['prediction_promotions']}")
	print(f" Reactive (cache miss): {results['reactive_promotions']}")
	print(f" Cold accesses avoided: {results['cold_accesses_avoided']}")

	print(f"\n Region Management:")
	print(f" Total regions: {results['total_regions']}")

	if results.get("promotion_log"):
	last = results["promotion_log"][-1]
	print(f" Final state: HOT={last['hot']} WARM={last['warm']} COLD={last['cold']}")

	# Per-region breakdown
	print(f"\n Per-Region Breakdown:")
	print(f" {'Region':<35} {'Tier':>5} {'Size':>8} {'Accesses':>8} {'Promos':>6}")
	print(f" {'-'35} {'-'5} {'-'8} {'-'8} {'-'*6}")

	sorted_regions = sorted(self.regions.values(),
	key=lambda r: -r.access_count)
	for region in sorted_regions[:20]:
	short = region.path if len(region.path) <= 35 else "..." + region.path[-32:]
	size_kb = region.original_size / 1024
	print(f" {short:<35} {region.tier:>5} {size_kb:>7.1f}K "
	f"{region.access_count:>8} {region.promotions:>6}")

	if len(sorted_regions) > 20:
	print(f" ... and {len(sorted_regions) - 20} more regions")

	# Compression ratios
	warm_regions = [r for r in self.regions.values() if r.tier == "WARM"]
	if warm_regions:
	ratios = [r.original_size / max(r.compressed_size, 1) for r in warm_regions]
	avg_ratio = np.mean(ratios)
	print(f"\n Compression: {len(warm_regions)} WARM regions, "
	f"avg ratio {avg_ratio:.1f}:1")

	print(f"\n{'='*60}\n")

	def cleanup(self):
	"""Remove cold storage temp files."""
	import shutil
	if os.path.exists(self.cold_dir) and self.cold_dir.startswith(tempfile.gettempdir()):
	shutil.rmtree(self.cold_dir, ignore_errors=True)