Spaces:

destinyebuka
/

AIDA

Running

App Files Files Community

AIDA / app /core /context_manager.py

destinyebuka

dora

4c9881b 3 months ago

raw

history blame contribute delete

10.1 kB

	# ============================================================
	# app/core/context_manager.py - Context Window Management
	# ============================================================

	import logging
	import json
	from typing import List, Dict, Optional, Tuple
	from datetime import datetime, timedelta
	import tiktoken

	from app.core.error_handling import LojizError

	logger = logging.getLogger(__name__)

	# ============================================================
	# Token Counter
	# ============================================================

	class TokenCounter:
	"""Count tokens using tiktoken (OpenAI's tokenizer)"""

	def __init__(self, encoding_name: str = "cl100k_base"):
	try:
	self.encoding = tiktoken.get_encoding(encoding_name)
	except Exception as e:
	logger.warning(f"⚠️ Failed to load tiktoken: {e}, using fallback")
	self.encoding = None

	def count_tokens(self, text: str) -> int:
	"""Count tokens in text"""
	if not self.encoding:
	# Fallback: rough estimate (4 chars ≈ 1 token)
	return len(text) // 4

	return len(self.encoding.encode(text))

	def count_messages_tokens(self, messages: List[Dict[str, str]]) -> int:
	"""Count tokens in message list"""
	total = 0

	for msg in messages:
	# Add overhead per message (role + content markers)
	total += 4

	if msg.get("role"):
	total += self.count_tokens(msg["role"])
	if msg.get("content"):
	total += self.count_tokens(msg["content"])

	# Add overhead for message framing
	total += 2

	return total

	# ============================================================
	# Context Manager
	# ============================================================

	class ContextManager:
	"""Manage context window to prevent overflow"""

	# Model limits (tokens)
	MODEL_LIMITS = {
	"deepseek-chat": 4096,
	"mistralai/mistral-7b-instruct": 8192,
	"xai-org/grok-beta": 8192,
	"meta-llama/llama-2-70b-chat": 4096,
	}

	# Reserve space for response
	RESPONSE_RESERVE = 600

	def __init__(self, model: str = "deepseek-chat"):
	self.model = model
	self.token_counter = TokenCounter()
	self.context_limit = self.MODEL_LIMITS.get(model, 4096)
	self.usable_limit = self.context_limit - self.RESPONSE_RESERVE

	def get_available_context(self, current_tokens: int) -> int:
	"""Get available context space"""
	return max(0, self.usable_limit - current_tokens)

	def is_context_full(self, messages: List[Dict[str, str]]) -> bool:
	"""Check if context is full"""
	tokens = self.token_counter.count_messages_tokens(messages)
	return tokens >= self.usable_limit

	async def manage_context(
	self,
	messages: List[Dict[str, str]],
	max_history_messages: int = 20,
	) -> List[Dict[str, str]]:
	"""
	Manage context by summarizing if needed

	Strategy:
	1. Keep system message
	2. Keep last message (current user input)
	3. Summarize older messages if needed
	"""

	if not messages:
	return messages

	tokens = self.token_counter.count_messages_tokens(messages)

	if tokens <= self.usable_limit:
	logger.debug(
	f"✅ Context OK: {tokens}/{self.usable_limit} tokens, "
	f"{len(messages)} messages"
	)
	return messages

	logger.warning(
	f"⚠️ Context overflow: {tokens}/{self.usable_limit} tokens, "
	f"{len(messages)} messages"
	)

	# Keep system message + last message, summarize the rest
	system_msg = [m for m in messages if m.get("role") == "system"]
	user_msg = [m for m in messages if m.get("role") == "user"][-1:] if messages else []

	history = [
	m for m in messages
	if m.get("role") not in ["system"] and m not in user_msg
	]

	# Trim history to most recent max_history_messages
	if len(history) > max_history_messages:
	logger.info(f"📦 Trimming history from {len(history)} to {max_history_messages}")
	history = history[-max_history_messages:]

	# Rebuild messages
	managed_messages = system_msg + history + user_msg

	final_tokens = self.token_counter.count_messages_tokens(managed_messages)
	logger.info(
	f"📦 Context managed: {final_tokens}/{self.usable_limit} tokens, "
	f"{len(managed_messages)} messages"
	)

	return managed_messages

	async def summarize_conversation(
	self,
	messages: List[Dict[str, str]],
	summarizer_fn = None,
	) -> str:
	"""
	Summarize conversation history

	Args:
	messages: Message history
	summarizer_fn: Optional async function to summarize

	Returns:
	Summary of conversation
	"""

	if not messages or len(messages) < 3:
	return ""

	# Extract conversation content (skip system message)
	conversation = [
	m for m in messages
	if m.get("role") != "system"
	]

	conversation_text = "\n".join([
	f"{m.get('role', 'unknown').upper()}: {m.get('content', '')[:200]}"
	for m in conversation
	])

	# If no custom summarizer, use basic extraction
	if not summarizer_fn:
	return self._basic_summary(conversation)

	# Use custom summarizer
	try:
	summary = await summarizer_fn(conversation_text)
	return summary
	except Exception as e:
	logger.warning(f"⚠️ Summarization failed: {e}, using basic summary")
	return self._basic_summary(conversation)

	def _basic_summary(self, messages: List[Dict[str, str]]) -> str:
	"""Basic summary extraction"""

	summaries = []

	for msg in messages[-10:]: # Last 10 messages
	content = msg.get("content", "")
	if len(content) > 100:
	# Extract key points
	lines = content.split("\n")
	key_lines = [l for l in lines if len(l) > 20][:2]
	summaries.append(" ".join(key_lines))
	else:
	summaries.append(content)

	return " \| ".join(summaries)

	# ============================================================
	# Message Window (sliding window)
	# ============================================================

	class MessageWindow:
	"""Sliding window for conversation history"""

	def __init__(self, window_size: int = 20, max_age_minutes: int = 120):
	self.window_size = window_size
	self.max_age = timedelta(minutes=max_age_minutes)
	self.messages: List[Dict[str, str]] = []
	self.created_at = datetime.utcnow()

	def add_message(self, role: str, content: str) -> None:
	"""Add message to window"""
	msg = {
	"role": role,
	"content": content,
	"timestamp": datetime.utcnow().isoformat(),
	}
	self.messages.append(msg)

	# Maintain window size
	if len(self.messages) > self.window_size:
	removed = self.messages.pop(0)
	logger.debug(f"📤 Removed old message from window")

	def get_messages(self, include_timestamps: bool = False) -> List[Dict[str, str]]:
	"""Get messages in window"""
	messages = self.messages

	if not include_timestamps:
	# Remove timestamps for API calls
	messages = [
	{k: v for k, v in m.items() if k != "timestamp"}
	for m in messages
	]

	return messages

	def is_expired(self) -> bool:
	"""Check if window has expired"""
	return datetime.utcnow() - self.created_at > self.max_age

	def clear(self) -> None:
	"""Clear window"""
	self.messages = []
	self.created_at = datetime.utcnow()

	def get_stats(self) -> Dict[str, int]:
	"""Get window statistics"""
	return {
	"message_count": len(self.messages),
	"max_size": self.window_size,
	"age_seconds": int((datetime.utcnow() - self.created_at).total_seconds()),
	}

	# ============================================================
	# Global Context Manager
	# ============================================================

	_context_managers = {}
	_message_windows = {}

	def get_context_manager(model: str = "deepseek-chat") -> ContextManager:
	"""Get or create context manager"""
	if model not in _context_managers:
	_context_managers[model] = ContextManager(model)
	return _context_managers[model]

	def get_message_window(user_id: str, create_if_missing: bool = True) -> Optional[MessageWindow]:
	"""Get or create message window for user"""
	if user_id not in _message_windows:
	if create_if_missing:
	_message_windows[user_id] = MessageWindow()
	else:
	return None

	window = _message_windows[user_id]

	# Check if expired
	if window.is_expired():
	logger.info(f"🗑️ Clearing expired window for user {user_id}")
	window.clear()

	return window

	def cleanup_expired_windows() -> int:
	"""Clean up expired message windows"""
	expired = [
	user_id for user_id, window in _message_windows.items()
	if window.is_expired()
	]

	for user_id in expired:
	del _message_windows[user_id]

	if expired:
	logger.info(f"🧹 Cleaned up {len(expired)} expired windows")

	return len(expired)