Spaces:

petermutwiri
/

analytics-engine

Paused

App Files Files Community

shaliz-kong commited on Dec 1, 2025

Commit

dad89dc

1 Parent(s): cb1b04b

added redis hammer rate limiting

Browse files

Files changed (2) hide show

app/service/vector_service.py +18 -12
app/tasks/analytics_worker.py +1 -1

app/service/vector_service.py CHANGED Viewed

@@ -220,39 +220,45 @@ class VectorService:
         metadata: List[Dict[str, Any]],
         namespace: str
     ):
-        """Store in Redis with 24h TTL (non-blocking)"""
         try:
             stored = 0
-            # Process in smaller batches to reduce HTTP calls
-            batch_size = 50
             for i in range(0, len(embeddings), batch_size):
                 batch_embeddings = embeddings[i:i + batch_size]
                 batch_metadata = metadata[i:i + batch_size]
-                # Store batch sequentially but non-blocking
                 for idx, (emb, meta) in enumerate(zip(batch_embeddings, batch_metadata)):
                     global_idx = i + idx
                     key = f"vector:{namespace}:{global_idx}:{int(time.time())}"
-                    # ✅ FIX: Run in thread pool to avoid blocking
-                    await asyncio.to_thread(
                         event_hub.setex,
                         key,
-                        86400,
                         json.dumps({
                             "embedding": emb,
                             "metadata": meta,
                             "org_id": self.org_id
                         })
                     )
-                    stored += 1
-                # Small delay every batch to prevent overwhelming Redis
                 if i > 0 and i % 200 == 0:
-                    await asyncio.sleep(0.01)
             logger.info(f"[✅ VECTOR] Redis: Stored {stored} vectors (non-blocking)")
         except Exception as e:

         metadata: List[Dict[str, Any]],
         namespace: str
     ):
+        """
+        🛡️ **Redis storage - NON-BLOCKING with rate limiting**
+        Processes in batches with small delays to prevent overwhelming Redis
+        """
         try:
             stored = 0
+            batch_size = 50  # Store 50 at a time
             for i in range(0, len(embeddings), batch_size):
                 batch_embeddings = embeddings[i:i + batch_size]
                 batch_metadata = metadata[i:i + batch_size]
+                # Process batch with concurrent tasks (max 10 at once)
+                tasks = []
                 for idx, (emb, meta) in enumerate(zip(batch_embeddings, batch_metadata)):
                     global_idx = i + idx
                     key = f"vector:{namespace}:{global_idx}:{int(time.time())}"
+                    # Create task for non-blocking Redis call
+                    task = asyncio.to_thread(
                         event_hub.setex,
                         key,
+                        86400,  # 24 hours
                         json.dumps({
                             "embedding": emb,
                             "metadata": meta,
                             "org_id": self.org_id
                         })
                     )
+                    tasks.append(task)
+                # Run batch concurrently
+                await asyncio.gather(*tasks, return_exceptions=True)
+                stored += len(batch_embeddings)
+                # ✅ **RATE LIMITING**: Sleep every 200 vectors
                 if i > 0 and i % 200 == 0:
+                    await asyncio.sleep(0.01)  # 10ms pause
             logger.info(f"[✅ VECTOR] Redis: Stored {stored} vectors (non-blocking)")
         except Exception as e:

app/tasks/analytics_worker.py CHANGED Viewed

@@ -486,7 +486,7 @@ class AnalyticsWorker:
             # 3️⃣ Store in vector service (Redis + DuckDB VSS)
             namespace = f"{self._entity_type}:{self.org_id}"
-            vector_service.upsert_embeddings(
                 embeddings=embeddings,
                 metadata=metadata,
                 namespace=namespace

             # 3️⃣ Store in vector service (Redis + DuckDB VSS)
             namespace = f"{self._entity_type}:{self.org_id}"
+            await vector_service.upsert_embeddings(
                 embeddings=embeddings,
                 metadata=metadata,
                 namespace=namespace