Spaces:

Seth0330
/

Multi_Model_AI_AGENT_VectorDB_langchain_json

Sleeping

Seth0330 commited on Jun 12, 2025

Commit

e604e69

verified ·

1 Parent(s): 7bbdd37

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,9 +11,8 @@ import openai
 from langchain.schema import Document
 from langchain.chains import RetrievalQA
 from langchain_community.llms import OpenAI as LangOpenAI
-# --- FIX: Import correct BaseRetriever
 from langchain_core.retrievers import BaseRetriever
 # ---- CONFIG ----
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
@@ -96,7 +95,6 @@ def ingest_json_files(files):
     for file in files:
         raw = json.load(file)
         source_name = file.name
-        # Handle top-level list/dict
         if isinstance(raw, list):
             records = raw
         elif isinstance(raw, dict):
@@ -109,7 +107,6 @@ def ingest_json_files(files):
             records = [raw]
         for rec in records:
             flat = flatten_json_obj(rec)
-            # Add entity keys if found
             if "customer" in rec and isinstance(rec["customer"], str):
                 first_name = rec["customer"].split("@")[0].replace(".", " ")
                 flat["customer_name"] = first_name
@@ -155,9 +152,7 @@ def query_vector_db(user_query, top_k=5):
 # ---- LangChain Retriever Adapter ----
 class SQLiteVectorRetriever(BaseRetriever):
-    def __init__(self, top_k=5):
-        self.top_k = top_k
-        super().__init__()
     def get_relevant_documents(self, query: str) -> List[Document]:
         return query_vector_db(query, self.top_k)

 from langchain.schema import Document
 from langchain.chains import RetrievalQA
 from langchain_community.llms import OpenAI as LangOpenAI
 from langchain_core.retrievers import BaseRetriever
+from pydantic import Field
 # ---- CONFIG ----
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
     for file in files:
         raw = json.load(file)
         source_name = file.name
         if isinstance(raw, list):
             records = raw
         elif isinstance(raw, dict):
             records = [raw]
         for rec in records:
             flat = flatten_json_obj(rec)
             if "customer" in rec and isinstance(rec["customer"], str):
                 first_name = rec["customer"].split("@")[0].replace(".", " ")
                 flat["customer_name"] = first_name
 # ---- LangChain Retriever Adapter ----
 class SQLiteVectorRetriever(BaseRetriever):
+    top_k: int = Field(default=5)
     def get_relevant_documents(self, query: str) -> List[Document]:
         return query_vector_db(query, self.top_k)