Spaces:

cmd0160
/

abalone_chat_application

Sleeping

App Files Files Community

cmd0160 commited on Dec 8, 2025

Commit

0438c70

1 Parent(s): ee749be

Fixing deployment

Browse files

Files changed (5) hide show

.gitignore +0 -4
src/ingest.py +0 -14
src/utils/__pycache__/rag_runtime.cpython-310.pyc +0 -0
src/utils/rag_runtime.py +1 -11
src/vectorstore.py +2 -5

.gitignore CHANGED Viewed

@@ -11,7 +11,3 @@ __pycache__/
 # /data/
 # tests / validation artifacts
 # /validation/
-EOF
-git add .gitignore
-# do NOT commit this yet if you prefer to review

 # /data/
 # tests / validation artifacts
 # /validation/

src/ingest.py CHANGED Viewed

@@ -1,12 +1,10 @@
 import argparse
 import os
-<<<<<<< HEAD
 from langchain_community.document_loaders import DirectoryLoader, TextLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import OpenAIEmbeddings
-=======
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import OpenAIEmbeddings
@@ -22,7 +20,6 @@ try:
     _HAS_KG = True
 except Exception:
     _HAS_KG = False
->>>>>>> ba5a1f4 (Adding kg to deployment)
 def load_documents(data_dir: str):
@@ -72,8 +69,6 @@ def ingest(data_dir: str, persist_dir: str, chunk_size: int, chunk_overlap: int)
     os.makedirs(persist_dir, exist_ok=True)
-<<<<<<< HEAD
-=======
     # Prepare KG store and local chunk index
     chunks_index = {}
     kg_path = os.path.join(persist_dir, "kg_store.ttl")
@@ -125,15 +120,12 @@ def ingest(data_dir: str, persist_dir: str, chunk_size: int, chunk_overlap: int)
                 pass
     # Persist Chroma vectorstore
->>>>>>> ba5a1f4 (Adding kg to deployment)
     Chroma.from_documents(
         split_docs,
         embedding=embeddings,
         persist_directory=persist_dir,
     )
     print(f"Vectorstore built and persisted to {persist_dir}")
-<<<<<<< HEAD
-=======
     # Persist chunks index for runtime (simple json mapping)
     try:
@@ -150,20 +142,14 @@ def ingest(data_dir: str, persist_dir: str, chunk_size: int, chunk_overlap: int)
             print(f"KG persisted to {kg_path}")
         except Exception:
             pass
->>>>>>> ba5a1f4 (Adding kg to deployment)
 def main():
     parser = argparse.ArgumentParser()
     parser.add_argument("--data-dir", type=str, default="./data")
     parser.add_argument("--persist-dir", type=str, default="./vectorstore")
-<<<<<<< HEAD
-    parser.add_argument("--chunk-size", type=int, default=800)
-    parser.add_argument("--chunk-overlap", type=int, default=200)
-=======
     parser.add_argument("--chunk-size", type=int, default=200)
     parser.add_argument("--chunk-overlap", type=int, default=50)
->>>>>>> ba5a1f4 (Adding kg to deployment)
     args = parser.parse_args()
     ingest(

 import argparse
 import os
 from langchain_community.document_loaders import DirectoryLoader, TextLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import OpenAIEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import OpenAIEmbeddings
     _HAS_KG = True
 except Exception:
     _HAS_KG = False
 def load_documents(data_dir: str):
     os.makedirs(persist_dir, exist_ok=True)
     # Prepare KG store and local chunk index
     chunks_index = {}
     kg_path = os.path.join(persist_dir, "kg_store.ttl")
                 pass
     # Persist Chroma vectorstore
     Chroma.from_documents(
         split_docs,
         embedding=embeddings,
         persist_directory=persist_dir,
     )
     print(f"Vectorstore built and persisted to {persist_dir}")
     # Persist chunks index for runtime (simple json mapping)
     try:
             print(f"KG persisted to {kg_path}")
         except Exception:
             pass
 def main():
     parser = argparse.ArgumentParser()
     parser.add_argument("--data-dir", type=str, default="./data")
     parser.add_argument("--persist-dir", type=str, default="./vectorstore")
     parser.add_argument("--chunk-size", type=int, default=200)
     parser.add_argument("--chunk-overlap", type=int, default=50)
     args = parser.parse_args()
     ingest(

src/utils/__pycache__/rag_runtime.cpython-310.pyc CHANGED Viewed

Binary files a/src/utils/__pycache__/rag_runtime.cpython-310.pyc and b/src/utils/__pycache__/rag_runtime.cpython-310.pyc differ

src/utils/rag_runtime.py CHANGED Viewed

@@ -6,8 +6,6 @@ import streamlit as st
 from src.vectorstore import get_retriever
 from src.qa_chain import make_conversational_chain
-<<<<<<< HEAD
-=======
 import os
 import json
 from typing import Dict, List, Tuple
@@ -18,7 +16,6 @@ try:
     _HAS_KG = True
 except Exception:
     _HAS_KG = False
->>>>>>> ba5a1f4 (Adding kg to deployment)
 def run_ingest_cli(data_dir: str, persist_dir: str) -> None:
@@ -31,10 +28,7 @@ def run_ingest_cli(data_dir: str, persist_dir: str) -> None:
     Raises:
         CalledProcessError: If the underlying subprocess fails.
     """
-<<<<<<< HEAD
-=======
-    # Updated to point to the CLI module inside the ingest package
->>>>>>> ba5a1f4 (Adding kg to deployment)
     cmd = [
         sys.executable,
         "-m",
@@ -46,9 +40,6 @@ def run_ingest_cli(data_dir: str, persist_dir: str) -> None:
     ]
     subprocess.run(cmd, check=True)
-<<<<<<< HEAD
-=======
 def _load_chunks_index(persist_dir: str) -> Dict[str, Dict]:
     idx_path = os.path.join(persist_dir, "chunks_index.json")
     if not os.path.exists(idx_path):
@@ -107,7 +98,6 @@ def answer_with_kg(
     return chain({"question": augmented_question, "chat_history": chat_history})
->>>>>>> ba5a1f4 (Adding kg to deployment)
 @st.cache_resource(show_spinner=False)
 def build_or_load_retriever_cached(
         data_dir: str,

 from src.vectorstore import get_retriever
 from src.qa_chain import make_conversational_chain
 import os
 import json
 from typing import Dict, List, Tuple
     _HAS_KG = True
 except Exception:
     _HAS_KG = False
 def run_ingest_cli(data_dir: str, persist_dir: str) -> None:
     Raises:
         CalledProcessError: If the underlying subprocess fails.
     """
     cmd = [
         sys.executable,
         "-m",
     ]
     subprocess.run(cmd, check=True)
 def _load_chunks_index(persist_dir: str) -> Dict[str, Dict]:
     idx_path = os.path.join(persist_dir, "chunks_index.json")
     if not os.path.exists(idx_path):
     return chain({"question": augmented_question, "chat_history": chat_history})
 @st.cache_resource(show_spinner=False)
 def build_or_load_retriever_cached(
         data_dir: str,

src/vectorstore.py CHANGED Viewed

@@ -51,11 +51,8 @@ class HybridRetriever(BaseRetriever):
 def get_retriever(
         persist_dir: str,
         top_k: int,
-<<<<<<< HEAD
-        retrieval_mode: RetrievalMode = "mmr",
-=======
-        retrieval_mode: RetrievalMode = "hybrid",
->>>>>>> ba5a1f4 (Adding kg to deployment)
 ):
     db = get_vectorstore(persist_dir=persist_dir)
     mode = retrieval_mode.lower()

 def get_retriever(
         persist_dir: str,
         top_k: int,
+        retrieval_mode: RetrievalMode = "hybrid"
 ):
     db = get_vectorstore(persist_dir=persist_dir)
     mode = retrieval_mode.lower()