Spaces:

anhkhoiphan
/

092_agent_api

Sleeping

App Files Files Community

anhkhoiphan commited on 12 days ago

Commit

c812bd3

1 Parent(s): 55834a6

Bổ sung tính năng scale buffer memory theo số thành viên trong nhóm

Browse files

Files changed (3) hide show

api_requirements.txt +1 -0
config.py +4 -0
conversation_memory.py +79 -31

api_requirements.txt CHANGED Viewed

@@ -15,3 +15,4 @@ pdfplumber>=0.11.0
 openai>=1.50.0
 fastembed>=0.4.0
 qdrant-client>=1.10.0

 openai>=1.50.0
 fastembed>=0.4.0
 qdrant-client>=1.10.0
+supabase>=2.0.0

config.py CHANGED Viewed

@@ -29,6 +29,10 @@ if REDIS_URL:
 QDRANT_URL     = os.getenv("QDRANT_URL", "")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY", "")
 # Logging
 LOG_LEVEL = os.getenv("LOG_LEVEL", "INFO")

 QDRANT_URL     = os.getenv("QDRANT_URL", "")
 QDRANT_API_KEY = os.getenv("QDRANT_API_KEY", "")
+# Supabase
+SUPABASE_URL              = os.getenv("SUPABASE_URL", "")
+SUPABASE_SERVICE_ROLE_KEY = os.getenv("SUPABASE_SERVICE_ROLE_KEY", "")
 # Logging
 LOG_LEVEL = os.getenv("LOG_LEVEL", "INFO")

conversation_memory.py CHANGED Viewed

@@ -1,12 +1,14 @@
 """
 ConversationSummaryBufferMemory — Qdrant-backed.
-Buffer: tối đa MAX_BUFFER tin nhắn.
-Khi vượt quá: tóm tắt SUMMARIZE_COUNT tin cũ nhất, giữ lại KEEP_RECENT tin mới nhất.
-Lưu cả summary và buffer trên Qdrant (payload-only, dummy vector).
 """
-import json
 import logging
 import uuid
 from typing import Optional
@@ -15,27 +17,27 @@ from langchain_core.messages import HumanMessage, SystemMessage
 from qdrant_client import QdrantClient
 from qdrant_client.models import Distance, PointStruct, VectorParams
-from src.config import QDRANT_API_KEY, QDRANT_URL
 from src.llm import llm
 logger = logging.getLogger(__name__)
-MAX_BUFFER      = 100   # ngưỡng trigger summarization
-SUMMARIZE_COUNT = 60   # số tin nhắn cũ nhất sẽ được tóm tắt
-KEEP_RECENT     = 40   # số tin nhắn giữ lại trong buffer sau summarization
 _COLLECTION   = "conversation_memory"
 _DUMMY_VECTOR = [0.0]
-_client: Optional[QdrantClient] = None
-def _get_client() -> QdrantClient:
-    global _client
-    if _client is None:
-        _client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
-        _ensure_collection(_client)
-    return _client
 def _ensure_collection(client: QdrantClient) -> None:
@@ -52,6 +54,51 @@ def _point_id(conversation_id: str) -> str:
     return str(uuid.uuid5(uuid.NAMESPACE_DNS, f"conv:{conversation_id}"))
 # ── Load / Save ───────────────────────────────────────────────────────────────
 def load(conversation_id: str) -> tuple[str, list[dict]]:
@@ -59,7 +106,7 @@ def load(conversation_id: str) -> tuple[str, list[dict]]:
     if not QDRANT_URL:
         return "", []
     try:
-        results = _get_client().retrieve(
             collection_name=_COLLECTION,
             ids=[_point_id(conversation_id)],
             with_payload=True,
@@ -79,7 +126,7 @@ def save(conversation_id: str, summary: str, buffer: list[dict]) -> None:
     if not QDRANT_URL:
         return
     try:
-        _get_client().upsert(
             collection_name=_COLLECTION,
             points=[PointStruct(
                 id=_point_id(conversation_id),
@@ -134,19 +181,19 @@ def _summarize(existing_summary: str, messages: list[dict]) -> str:
 def add_turn(conversation_id: str, user_msg: str, ai_msg: str) -> None:
     """Thêm 1 lượt user+assistant vào buffer, trigger summarize nếu cần."""
     summary, buffer = load(conversation_id)
     buffer.append({"role": "user",      "content": user_msg})
     buffer.append({"role": "assistant", "content": ai_msg})
-    if len(buffer) > MAX_BUFFER:
-        to_summarize = buffer[:SUMMARIZE_COUNT]
-        buffer       = buffer[SUMMARIZE_COUNT:]        # giữ lại phần còn lại
-        # Đảm bảo buffer không vượt KEEP_RECENT sau khi cắt
-        if len(buffer) > KEEP_RECENT:
-            buffer = buffer[-KEEP_RECENT:]
         logger.info(
             "[Memory] Buffer vượt %d, tóm tắt %d tin → giữ %d tin.",
-            MAX_BUFFER, len(to_summarize), len(buffer),
         )
         summary = _summarize(summary, to_summarize)
@@ -157,7 +204,7 @@ def seed_room(conversation_id: str, messages: list[dict]) -> None:
     """
     Seed Qdrant buffer từ danh sách tin nhắn Redis thô.
     Mỗi message được chuyển thành role='user', content='[ts] name (id): content'.
-    Nếu vượt MAX_BUFFER thì tự động summarize trước khi lưu.
     """
     _NAME_FIELDS = ["sender_username", "username", "u_username", "name", "u_name",
                     "senderName", "displayName", "display_name", "fullName", "sender_id"]
@@ -179,12 +226,13 @@ def seed_room(conversation_id: str, messages: list[dict]) -> None:
         label   = f"{name} ({sid})" if sid != name else name
         buffer.append({"role": "user", "content": f"[{ts}] {label}: {content}"})
     summary = ""
-    while len(buffer) > MAX_BUFFER:
-        to_summarize = buffer[:SUMMARIZE_COUNT]
-        buffer       = buffer[SUMMARIZE_COUNT:]
-        if len(buffer) > KEEP_RECENT:
-            buffer = buffer[-KEEP_RECENT:]
         logger.info(
             "[Memory] seed_room: tóm tắt %d tin → giữ %d tin còn lại",
             len(to_summarize), len(buffer),

 """
 ConversationSummaryBufferMemory — Qdrant-backed.
+Giới hạn buffer tính theo số thành viên room (n):
+  MAX_BUFFER      = 10n
+  SUMMARIZE_COUNT =  6n  (số tin cũ nhất được tóm tắt khi vượt ngưỡng)
+  KEEP_RECENT     =  4n  (số tin giữ lại trong buffer sau khi tóm tắt)
+Fallback n = 20 nếu không kết nối được Supabase hoặc không phải room.
 """
 import logging
 import uuid
 from typing import Optional
 from qdrant_client import QdrantClient
 from qdrant_client.models import Distance, PointStruct, VectorParams
+from src.config import QDRANT_API_KEY, QDRANT_URL, SUPABASE_SERVICE_ROLE_KEY, SUPABASE_URL
 from src.llm import llm
 logger = logging.getLogger(__name__)
+_DEFAULT_N    = 20
 _COLLECTION   = "conversation_memory"
 _DUMMY_VECTOR = [0.0]
+_qdrant_client: Optional[QdrantClient] = None
+_sb_client = None
+# ── Qdrant client ─────────────────────────────────────────────────────────────
+def _get_qdrant() -> QdrantClient:
+    global _qdrant_client
+    if _qdrant_client is None:
+        _qdrant_client = QdrantClient(url=QDRANT_URL, api_key=QDRANT_API_KEY)
+        _ensure_collection(_qdrant_client)
+    return _qdrant_client
 def _ensure_collection(client: QdrantClient) -> None:
     return str(uuid.uuid5(uuid.NAMESPACE_DNS, f"conv:{conversation_id}"))
+# ── Supabase client ───────────────────────────────────────────────────────────
+def _get_sb():
+    global _sb_client
+    if _sb_client is None and SUPABASE_URL and SUPABASE_SERVICE_ROLE_KEY:
+        try:
+            from supabase import create_client
+            _sb_client = create_client(SUPABASE_URL, SUPABASE_SERVICE_ROLE_KEY)
+        except Exception:
+            logger.exception("[Memory] Không khởi tạo được Supabase client.")
+    return _sb_client
+# ── Dynamic limits ────────────────────────────────────────────────────────────
+def _get_member_count(conversation_id: str) -> int:
+    """Lấy số thành viên trong room từ Supabase. Fallback về _DEFAULT_N."""
+    if not conversation_id.startswith("room-"):
+        return _DEFAULT_N
+    sb = _get_sb()
+    if sb is None:
+        return _DEFAULT_N
+    room_id = conversation_id.removeprefix("room-")
+    try:
+        res = (
+            sb.table("room_members")
+            .select("user_id", count="exact")
+            .eq("room_id", room_id)
+            .execute()
+        )
+        n = res.count or 0
+        return n if n > 0 else _DEFAULT_N
+    except Exception:
+        logger.exception("[Memory] Lỗi lấy số thành viên room '%s'", room_id)
+        return _DEFAULT_N
+def _get_limits(conversation_id: str) -> tuple[int, int, int]:
+    """Trả về (max_buffer, summarize_count, keep_recent) theo số thành viên n."""
+    n = _get_member_count(conversation_id)
+    return 10 * n, 6 * n, 4 * n
 # ── Load / Save ───────────────────────────────────────────────────────────────
 def load(conversation_id: str) -> tuple[str, list[dict]]:
     if not QDRANT_URL:
         return "", []
     try:
+        results = _get_qdrant().retrieve(
             collection_name=_COLLECTION,
             ids=[_point_id(conversation_id)],
             with_payload=True,
     if not QDRANT_URL:
         return
     try:
+        _get_qdrant().upsert(
             collection_name=_COLLECTION,
             points=[PointStruct(
                 id=_point_id(conversation_id),
 def add_turn(conversation_id: str, user_msg: str, ai_msg: str) -> None:
     """Thêm 1 lượt user+assistant vào buffer, trigger summarize nếu cần."""
     summary, buffer = load(conversation_id)
+    max_buffer, summarize_count, keep_recent = _get_limits(conversation_id)
     buffer.append({"role": "user",      "content": user_msg})
     buffer.append({"role": "assistant", "content": ai_msg})
+    if len(buffer) > max_buffer:
+        to_summarize = buffer[:summarize_count]
+        buffer       = buffer[summarize_count:]
+        if len(buffer) > keep_recent:
+            buffer = buffer[-keep_recent:]
         logger.info(
             "[Memory] Buffer vượt %d, tóm tắt %d tin → giữ %d tin.",
+            max_buffer, len(to_summarize), len(buffer),
         )
         summary = _summarize(summary, to_summarize)
     """
     Seed Qdrant buffer từ danh sách tin nhắn Redis thô.
     Mỗi message được chuyển thành role='user', content='[ts] name (id): content'.
+    Nếu vượt max_buffer thì tự động summarize trước khi lưu.
     """
     _NAME_FIELDS = ["sender_username", "username", "u_username", "name", "u_name",
                     "senderName", "displayName", "display_name", "fullName", "sender_id"]
         label   = f"{name} ({sid})" if sid != name else name
         buffer.append({"role": "user", "content": f"[{ts}] {label}: {content}"})
+    max_buffer, summarize_count, keep_recent = _get_limits(conversation_id)
     summary = ""
+    while len(buffer) > max_buffer:
+        to_summarize = buffer[:summarize_count]
+        buffer       = buffer[summarize_count:]
+        if len(buffer) > keep_recent:
+            buffer = buffer[-keep_recent:]
         logger.info(
             "[Memory] seed_room: tóm tắt %d tin → giữ %d tin còn lại",
             len(to_summarize), len(buffer),