Initial upload of MnemoCore

dbb04e4 verified about 1 month ago

9.2 kB

	# MnemoCore Kubernetes Deployment

	This directory contains Kubernetes manifests and Helm charts for deploying MnemoCore to a Kubernetes cluster.

	## Overview

	MnemoCore is a cognitive memory infrastructure that uses Hyperdimensional Computing (HDC) to provide persistent, scalable memory for AI systems. The Kubernetes deployment includes:

	- MnemoCore API - Main API service with health checks and metrics
	- Redis - In-memory data store for hot tier and caching
	- Qdrant - Vector database for similarity search

	## Prerequisites

	- Kubernetes 1.25+
	- Helm 3.8+
	- kubectl configured to access your cluster
	- (Optional) Prometheus Operator for metrics scraping
	- (Optional) cert-manager for TLS certificates

	## Quick Start

	### 1. Install using Helm

	```bash
	# Add required Helm repositories
	helm repo add bitnami https://charts.bitnami.com/bitnami
	helm repo add qdrant https://qdrant.github.io/qdrant-helm
	helm repo update

	# Install MnemoCore with default values
	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--create-namespace \
	--set mnemocore.apiKey.value="your-secure-api-key"
	```

	### 2. Install with custom values

	```bash
	# Create a values file
	cat > values-prod.yaml << EOF
	mnemocore:
	replicaCount: 3
	apiKey:
	existingSecret: mnemocore-api-key
	resources:
	limits:
	cpu: "4"
	memory: "4Gi"
	requests:
	cpu: "1"
	memory: "1Gi"
	autoscaling:
	enabled: true
	minReplicas: 3
	maxReplicas: 20
	targetCPUUtilizationPercentage: 60

	redis:
	persistence:
	size: 20Gi

	qdrant:
	persistence:
	size: 100Gi

	global:
	storageClass: "fast-ssd"
	EOF

	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--create-namespace \
	-f values-prod.yaml
	```

	### 3. Verify the installation

	```bash
	# Check pod status
	kubectl get pods -n mnemocore

	# Check services
	kubectl get svc -n mnemocore

	# Check HPA status
	kubectl get hpa -n mnemocore

	# Port-forward for local testing
	kubectl port-forward svc/mnemocore 8100:8100 -n mnemocore

	# Test the API
	curl http://localhost:8100/health
	```

	## Configuration

	### Key Configuration Parameters

	\| Parameter \| Description \| Default \|
	\|-----------\|-------------\|---------\|
	\| `mnemocore.replicaCount` \| Number of API replicas \| `2` \|
	\| `mnemocore.image.repository` \| Container image repository \| `mnemocore` \|
	\| `mnemocore.image.tag` \| Container image tag \| `latest` \|
	\| `mnemocore.resources.limits.cpu` \| CPU limit \| `2` \|
	\| `mnemocore.resources.limits.memory` \| Memory limit \| `2Gi` \|
	\| `mnemocore.autoscaling.enabled` \| Enable HPA \| `true` \|
	\| `mnemocore.autoscaling.minReplicas` \| Minimum replicas \| `2` \|
	\| `mnemocore.autoscaling.maxReplicas` \| Maximum replicas \| `10` \|
	\| `mnemocore.apiKey.existingSecret` \| Existing secret for API key \| `""` \|
	\| `redis.enabled` \| Deploy Redis \| `true` \|
	\| `qdrant.enabled` \| Deploy Qdrant \| `true` \|

	### Resource Limits

	\| Component \| CPU Limit \| Memory Limit \| CPU Request \| Memory Request \|
	\|-----------\|-----------\|--------------\|-------------\|----------------\|
	\| MnemoCore \| 2 \| 2Gi \| 500m \| 512Mi \|
	\| Redis \| 1 \| 512Mi \| 100m \| 128Mi \|
	\| Qdrant \| 2 \| 4Gi \| 500m \| 1Gi \|

	### Probe Configuration

	\| Probe \| Initial Delay \| Period \| Timeout \| Failure Threshold \|
	\|-------\|---------------\|--------\|---------\|-------------------\|
	\| Liveness \| 40s \| 30s \| 10s \| 3 \|
	\| Readiness \| 20s \| 10s \| 5s \| 3 \|
	\| Startup \| 10s \| 10s \| 5s \| 30 \|

	## Production Deployment

	### 1. Create Secrets

	```bash
	# Create API key secret
	kubectl create secret generic mnemocore-api-key \
	--from-literal=HAIM_API_KEY='your-secure-api-key' \
	-n mnemocore

	# Or use sealed-secrets/external-secrets for GitOps
	```

	### 2. Configure Storage

	```bash
	# Ensure you have a storage class configured
	kubectl get storageclass

	# For production, use fast SSD storage
	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set global.storageClass=fast-ssd \
	--set mnemocore.persistence.size=50Gi \
	--set redis.persistence.size=20Gi \
	--set qdrant.persistence.size=200Gi
	```

	### 3. Enable Ingress

	```bash
	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set mnemocore.ingress.enabled=true \
	--set mnemocore.ingress.className=nginx \
	--set 'mnemocore.ingress.hosts[0].host=mnemocore.yourdomain.com' \
	--set 'mnemocore.ingress.hosts[0].paths[0].path=/' \
	--set 'mnemocore.ingress.hosts[0].paths[0].pathType=Prefix' \
	--set 'mnemocore.ingress.tls[0].secretName=mnemocore-tls' \
	--set 'mnemocore.ingress.tls[0].hosts[0]=mnemocore.yourdomain.com'
	```

	### 4. Enable Network Policies

	```bash
	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set networkPolicy.enabled=true
	```

	## Monitoring

	### Prometheus Integration

	```bash
	# Enable ServiceMonitor for Prometheus Operator
	helm install mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set serviceMonitor.enabled=true \
	--set serviceMonitor.labels.release=prometheus
	```

	### Available Metrics

	MnemoCore exposes the following metrics on port 9090:

	- `mnemocore_memory_count_total` - Total number of memories stored
	- `mnemocore_memory_tier_hot` - Number of memories in hot tier
	- `mnemocore_memory_tier_warm` - Number of memories in warm tier
	- `mnemocore_memory_tier_cold` - Number of memories in cold tier
	- `mnemocore_query_duration_seconds` - Query latency histogram
	- `mnemocore_ltp_avg` - Average LTP score
	- `mnemocore_api_requests_total` - Total API requests
	- `mnemocore_api_request_duration_seconds` - API request latency

	### Grafana Dashboard

	Import the provided `grafana-dashboard.json` to visualize MnemoCore metrics.

	## Scaling

	### Manual Scaling

	```bash
	# Scale to 5 replicas
	kubectl scale deployment mnemocore --replicas=5 -n mnemocore
	```

	### Autoscaling

	HPA is enabled by default. Customize scaling behavior:

	```bash
	helm upgrade mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set mnemocore.autoscaling.minReplicas=3 \
	--set mnemocore.autoscaling.maxReplicas=50 \
	--set mnemocore.autoscaling.targetCPUUtilizationPercentage=50
	```

	## Upgrading

	```bash
	# Upgrade to a new version
	helm upgrade mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set mnemocore.image.tag=v3.6.0

	# Rollback if needed
	helm rollback mnemocore -n mnemocore
	```

	## Troubleshooting

	### Check Logs

	```bash
	# MnemoCore logs
	kubectl logs -l app.kubernetes.io/name=mnemocore -n mnemocore -f

	# Redis logs
	kubectl logs -l app.kubernetes.io/component=redis -n mnemocore -f

	# Qdrant logs
	kubectl logs -l app.kubernetes.io/component=qdrant -n mnemocore -f
	```

	### Common Issues

	1. Pod stuck in Pending
	- Check storage class availability
	- Check resource requests vs node capacity

	2. Health check failing
	- Check Redis and Qdrant connectivity
	- Verify environment variables

	3. High memory usage
	- Reduce `mnemocore.config.tiers.hot.max_memories`
	- Enable GPU for faster encoding

	### Debug Mode

	```bash
	# Run with debug logging
	helm upgrade mnemocore ./helm/mnemocore \
	--namespace mnemocore \
	--set mnemocore.env.logLevel=DEBUG
	```

	## Uninstalling

	```bash
	# Remove the Helm release
	helm uninstall mnemocore -n mnemocore

	# Remove the namespace (optional)
	kubectl delete namespace mnemocore

	# Remove PVCs (caution: data loss)
	kubectl delete pvc -n mnemocore --all
	```

	## Architecture

	```
	┌─────────────────┐
	│ Ingress │
	│ (Optional) │
	└────────┬────────┘
	│
	┌────────▼────────┐
	│ MnemoCore API │
	│ (HPA: 2-10) │
	│ Port: 8100 │
	└────────┬────────┘
	│
	┌──────────────┼──────────────┐
	│ │ │
	┌────────▼────────┐ │ ┌────────▼────────┐
	│ Redis │ │ │ Qdrant │
	│ Port: 6379 │ │ │ Port: 6333/6334 │
	│ Hot Tier Cache │ │ │ Vector Storage │
	└─────────────────┘ │ └─────────────────┘
	│
	┌───────▼───────┐
	│ Persistent │
	│ Storage │
	└───────────────┘
	```

	## License

	MIT License - See LICENSE file for details.