Spaces:

Sebunya
/

AskXeno

Build error

App Files Files Community

github-actions commited on Jan 27

Commit

3cdce90

1 Parent(s): 0aa781d

Sync from GitHub

Browse files

Files changed (26) hide show

.env.example +2 -0
.github/workflows/tests.yml +3 -3
XENO%20Uganda_KnowlegeBase_V1.json +0 -0
app.py +74 -465
docker-compose.yml +1 -0
requirements.txt +1 -1
src/config.py +4 -1
src/intent_classifier.py +46 -45
src/interface.py +121 -0
src/knowledge_base.py +43 -31
src/logger.py +190 -63
src/memory.py +19 -14
src/response_generator.py +30 -22
src/utils.py +18 -11
src/vector_store.py +60 -55
tests/conftest.py +55 -32
tests/test_app.py +411 -0
tests/test_intent_classifier.py +62 -56
tests/test_interface.py +135 -0
tests/test_knowledge_base.py +77 -65
tests/test_logger.py +95 -117
tests/test_memory.py +51 -60
tests/test_response_generator.py +77 -118
tests/test_utils.py +43 -41
tests/test_vector_store.py +221 -102
tox.ini +25 -0

.env.example ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ GOOGLE_SHEETS_CREDENTIALS = 'google_sheets_credentials.json'
2	+ GEMINI_API_KEY = "your_gemini_api_key_here"

.github/workflows/tests.yml CHANGED Viewed

@@ -2,9 +2,9 @@ name: Run Tests
 on:
   push:
-    branches: [ main, develop ]
   pull_request:
-    branches: [ main, develop ]
 jobs:
   test:
@@ -12,7 +12,7 @@ jobs:
     strategy:
       matrix:
-        python-version: ['3.11']
     steps:
     - uses: actions/checkout@v3

 on:
   push:
+    branches: [ main, development ]
   pull_request:
+    branches: [ main, development ]
 jobs:
   test:
     strategy:
       matrix:
+        python-version: ['3.13']
     steps:
     - uses: actions/checkout@v3

XENO%20Uganda_KnowlegeBase_V1.json DELETED Viewed

The diff for this file is too large to render. See raw diff

app.py CHANGED Viewed

@@ -2,46 +2,23 @@
 XENO Bot - AI-powered customer service assistant
 Main application file with Gradio interface
 """
-import os
-import uuid
-import gradio as gr
-import pandas as pd
-import torch
-import numpy as np
-from sentence_transformers import util
-from google import genai
-import chromadb
-from langchain_chroma import Chroma
-import gspread
-from google.oauth2.service_account import Credentials
-from langgraph.checkpoint.sqlite import SqliteSaver
-import sqlite3
-import json
-from datetime import datetime
-import re
-from typing import Dict, List, Tuple
-import time
-from contextlib import contextmanager
-import threading  # <--- Added for non-blocking feedback logging
 import logging
 import traceback
-# Import custom modules
-from src.utils import PipelineTimer
-from src.config import SIMILARITY_THRESHOLD, SERVER_NAME, SERVER_PORT
-from src.memory import create_session_config, update_memory, retrieve_memory
 from src.intent_classifier import IntentClassifier
-from src.vector_store import (
-    initialize_vector_store,
-    generate_embeddings,
-    calculate_similarity,
-    process_context
-)
-from src.response_generator import generate_xeno_response
 from src.logger import log_response, log_timing_data
-# Initialize components
-timer = PipelineTimer()
 # === Configuration ===
 # Ensure API Key is set
@@ -49,351 +26,61 @@ if "GEMINI_API_KEY" not in os.environ:
     print("WARNING: GEMINI_API_KEY environment variable not found.")
 # Initialize the client
-genai_client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY"))
-embedding_model = "models/embedding-001"
-llm_model_name = "models/gemma-3-4b-it"
-collection_name = "xeno_collection"
-# === Google Sheets Setup ===
-def get_google_sheets_credentials():
-    credentials_json = os.environ.get("GOOGLE_SHEETS_CREDENTIALS")
-    if not credentials_json:
-        raise ValueError("GOOGLE_SHEETS_CREDENTIALS environment variable not set.")
-    credentials_dict = json.loads(credentials_json)
-    scope = ["https://spreadsheets.google.com/feeds", "https://www.googleapis.com/auth/drive"]
-    creds = Credentials.from_service_account_info(credentials_dict, scopes=scope)
-    return creds
-# Authenticate
-try:
-    client_gspread = gspread.authorize(get_google_sheets_credentials())
-    spreadsheet = client_gspread.open("Response_Log")
-    response_sheet = spreadsheet.sheet1
-except Exception as e:
-    print(f"Error connecting to Google Sheets: {e}")
-    # Create dummy objects if connection fails to prevent app crash during dev
-    class DummySheet:
-        def append_row(self, *args, **kwargs): pass
-        def worksheet(self, *args): return self
-        def add_worksheet(self, *args, **kwargs): return self
-    spreadsheet = DummySheet()
-    response_sheet = DummySheet()
-# Setup Timing Sheet
-try:
-    timing_sheet = spreadsheet.worksheet("Timing_Log")
-except:
-    try:
-        timing_sheet = spreadsheet.add_worksheet(title="Timing_Log", rows="1000", cols="15")
-        headers = [
-            "Timestamp", "Session_ID", "Question", "Total_Time_MS",
-            "Intent_Classification_MS", "Memory_Retrieval_MS", "RAG_Retrieval_MS",
-            "Embedding_Generation_MS", "Similarity_Calculation_MS", "Context_Processing_MS",
-            "LLM_Generation_MS", "Memory_Update_MS", "Logging_MS", "Error_Step", "Notes"
-        ]
-        timing_sheet.append_row(headers)
-    except Exception as e:
-        print(f"Could not create Timing_Log sheet: {e}")
-        timing_sheet = None
-# === NEW: Setup Feedback Sheet ===
-try:
-    feedback_sheet = spreadsheet.worksheet("Feedback_Log")
-except:
-    try:
-        feedback_sheet = spreadsheet.add_worksheet(title="Feedback_Log", rows="1000", cols="6")
-        headers = ["Timestamp", "Session_ID", "User_Message", "Bot_Response", "Rating", "Flag_Reason"]
-        feedback_sheet.append_row(headers)
-    except Exception as e:
-        print(f"Could not create Feedback_Log sheet: {e}")
-        feedback_sheet = None
-# === Logging Functions ===
-def log_response(question, answer, source_ids, knowledge_pairs, session_id):
-    """Original response logging function"""
-    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
-    knowledge_question_1 = knowledge_pairs[0][0] if len(knowledge_pairs) > 0 else "N/A"
-    knowledge_answer_1 = knowledge_pairs[0][1] if len(knowledge_pairs) > 0 else "N/A"
-    knowledge_question_2 = knowledge_pairs[1][0] if len(knowledge_pairs) > 1 else "N/A"
-    knowledge_answer_2 = knowledge_pairs[1][1] if len(knowledge_pairs) > 1 else "N/A"
-    row = [
-        timestamp, session_id, question, answer, source_ids,
-        knowledge_question_1, knowledge_answer_1, knowledge_question_2, knowledge_answer_2
-    ]
-    try:
-        response_sheet.append_row(row)
-        print(f"Logged response: {question} | Source IDs: {source_ids}")
-    except Exception as e:
-        print(f"Failed to log to Google Sheet: {e}")
-        with open("/tmp/response_log.txt", "a") as f:
-            f.write(f"{timestamp},{question},{answer},{source_ids}\n")
-def log_timing_data(question, session_id, timing_summary, error_step=None, notes=None):
-    """Log timing data to the timing sheet"""
-    if timing_sheet is None: return
-    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
-    step_times = timing_summary['step_times']
-    row = [
-        timestamp,
-        session_id,
-        question[:100] + "..." if len(question) > 100 else question,
-        timing_summary['total_time_ms'],
-        step_times.get('intent_classification', 0),
-        step_times.get('memory_retrieval', 0),
-        step_times.get('rag_retrieval', 0),
-        step_times.get('embedding_generation', 0),
-        step_times.get('similarity_calculation', 0),
-        step_times.get('context_processing', 0),
-        step_times.get('llm_generation', 0),
-        step_times.get('memory_update', 0),
-        step_times.get('response_logging', 0),
-        error_step or "",
-        notes or ""
-    ]
-    try:
-        timing_sheet.append_row(row)
-        print(f"Logged timing data: Total {timing_summary['total_time_ms']}ms")
-    except Exception as e:
-        print(f"Failed to log timing data: {e}")
-# === NEW: Feedback Functions ===
-def _log_feedback_background(row):
-    """Helper to run network request in background thread"""
-    try:
-        if feedback_sheet:
-            feedback_sheet.append_row(row)
-            print("Feedback logged successfully.")
-        else:
-            print("Feedback sheet not available.")
-    except Exception as e:
-        print(f"Failed to log feedback: {e}")
-def submit_feedback(rating, reason, history, session_id):
-    """
-    Handles user feedback submission.
-    rating: 'Positive' or 'Negative'
-    reason: User provided text
-    history: Gradio chat history list
-    """
-    if not history or len(history) == 0:
-        return "No conversation to rate yet."
-    # Get the last interaction (Gradio history is a list of lists: [[user, bot], ...])
-    last_interaction = history[-1]
-    # Safety check for history format
-    if isinstance(last_interaction, list) and len(last_interaction) >= 2:
-        user_msg = last_interaction[0]
-        bot_msg = last_interaction[1]
-    else:
-        return "Error reading conversation history."
-    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
-    # Prepare row data
-    row = [timestamp, session_id, user_msg, bot_msg, rating, reason]
-    # Run in thread to prevent UI blocking
-    threading.Thread(target=_log_feedback_background, args=(row,)).start()
-    return f"Feedback received ({rating}). Thank you!"
-# === LangGraph Memory Setup ===
-conn = sqlite3.connect("xeno_memory.db", check_same_thread=False)
-memory = SqliteSaver(conn=conn)
-def update_memory(config, user_message, assistant_message):
-    with timer.time_step("memory_update"):
-        full_checkpoint = memory.get(config) or {}
-        messages = full_checkpoint.get("channel_values", {}).get("messages", [])
-        messages.append({"role": "user", "content": user_message})
-        messages.append({"role": "assistant", "content": assistant_message})
-        checkpoint_to_save = {
-            "v": 1,
-            "id": str(uuid.uuid4()),
-            "ts": datetime.now().isoformat(),
-            "channel_values": {"messages": messages},
-            "channel_versions": {},
-            "versions_seen": {},
-        }
-        memory.put(config, checkpoint_to_save, {}, {})
-def retrieve_memory(config):
-    with timer.time_step("memory_retrieval"):
-        full_checkpoint = memory.get(config) or {}
-        return full_checkpoint.get("channel_values", {}).get("messages", [])
 # === Intent Classification System ===
-class IntentClassifier:
-    def __init__(self):
-        self.intent_patterns = {
-            'greeting': {
-                'patterns': [
-                    r'\b(hi|hello|hey|good morning|good afternoon|good evening|greetings)\b',
-                    r'^(hi|hello|hey)[\s!.]*$',
-                    r'\b(how are you|how do you do)\b'
-                ],
-                'responses': [
-                    "Hello! I'm XENO Assistant. How can I help you with XENO financial services today?",
-                    "Hi there! I'm here to assist you with any questions about XENO services. What can I help you with?",
-                    "Good day! Welcome to XENO Support. How may I assist you today?"
-                ]
-            },
-            'thanks': {
-                'patterns': [
-                    r'\b(thank you|thanks|thank u|thx|appreciate|grateful)\b',
-                    r'^(thanks|thank you)[\s!.]*$',
-                    r'\b(much appreciated|thanks a lot|thank you so much)\b'
-                ],
-                'responses': [
-                    "You're welcome! Is there anything else I can help you with regarding XENO services?",
-                    "Happy to help! Feel free to ask if you have any other questions about XENO.",
-                    "Glad I could assist you! Let me know if you need help with anything else."
-                ]
-            },
-            'goodbye': {
-                'patterns': [
-                    r'\b(bye|goodbye|see you|farewell|take care|have a good day)\b',
-                    r'^(bye|goodbye)[\s!.]*$',
-                    r'\b(talk to you later|see you later|until next time)\b'
-                ],
-                'responses': [
-                    "Goodbye! Thank you for using XENO services. Have a great day!",
-                    "Take care! Feel free to return anytime you need help with XENO services.",
-                    "Have a wonderful day! Don't hesitate to reach out if you need assistance with XENO."
-                ]
-            }
-        }
-    def classify_intent(self, message: str) -> Tuple[str, str]:
-        message_lower = message.lower().strip()
-        for intent_name, intent_data in self.intent_patterns.items():
-            for pattern in intent_data['patterns']:
-                if re.search(pattern, message_lower, re.IGNORECASE):
-                    import random
-                    response = random.choice(intent_data['responses'])
-                    return intent_name, response
-        return 'query', ''
 intent_classifier = IntentClassifier()
 # === Load and Clean Knowledge Base ===
-try:
-    df_kb = pd.read_json("XENO_Uganda_KnowledgeBase_Advisory.json")
-    df_kb.dropna(subset=['Content'], inplace=True)
-    def prepare_documents(data):
-        documents, metadatas, ids = [], [], []
-        for item in data:
-            documents.append(f"Question: {item['Question']}\nAnswer: {item['Content']}")
-            metadatas.append({
-                "question": item["Question"],
-                "content": item["Content"],
-                "id": str(item["ID"])
-            })
-            ids.append(str(item["ID"]))
-        return documents, metadatas, ids
-    xeno_data_list = df_kb.to_dict('records')
-    documents, metadatas, ids = prepare_documents(xeno_data_list)
-except Exception as e:
-    print(f"Warning: Could not load JSON knowledge base: {e}")
-    documents, metadatas, ids = [], [], []
 # === Setup ChromaDB ===
-try:
-    client = chromadb.PersistentClient(path="/tmp/xeno_db")
-    try:
-        collection = client.get_collection(name=collection_name)
-        print(f"Loaded existing ChromaDB collection: {collection_name}")
-    except:
-        print(f"Creating new ChromaDB collection: {collection_name}")
-        collection = client.create_collection(name=collection_name)
-        if documents:
-            collection.add(documents=documents, metadatas=metadatas, ids=ids)
-except Exception as e:
-    print(f"Failed to initialize ChromaDB: {e}")
-    raise
-vector_store = Chroma(client=client, collection_name=collection_name)
-retriever = vector_store.as_retriever(search_type="similarity", search_kwargs={"k": 4})
-# === Prompt System ===
-SYSTEM_PROMPT = """You are a friendly XENO Support Assistant, an AI-powered helpful and professional customer service representative.
-Use only the information provided in the knowledge base context to answer user queries.
-Do not hallucinate. If context doesn't contain relevant info, say so in a calm polite manner by saying I'm sorry, I can't assist with that.
-Only use context that is clearly relevant to the user's question.
-For greetings like "hi" or "hello", respond politely without using the context.
-remember previous conversations."""
-# === Context Processing ===
-def process_context(results, cosine_scores, max_results=2):
-    with timer.time_step("context_processing"):
-        sorted_indices = np.argsort(cosine_scores)[::-1][:max_results]
-        formatted_context = ""
-        source_ids = []
-        knowledge_pairs = []
-        for i, idx in enumerate(sorted_indices, 1):
-            result = results[idx]
-            score = cosine_scores[idx]
-            question = result.metadata.get('question', 'N/A')
-            answer = result.metadata.get('content', 'N/A')
-            formatted_context += f"Knowledge Entry {i}:\n"
-            formatted_context += f"Q: {question}\n"
-            formatted_context += f"A: {answer}\n"
-            formatted_context += "-" * 40 + "\n"
-            source_ids.append(str(result.metadata.get('id', 'N/A')))
-            knowledge_pairs.append((question, answer))
-        return formatted_context, source_ids, knowledge_pairs
-# === LLM Generation ===
-def generate_xeno_response(context, question, chat_history):
-    with timer.time_step("llm_generation"):
-        formatted_history = "\n".join(
-            [f"{msg['role'].capitalize()}: {msg['content']}" for msg in chat_history]
-        ) if chat_history else "None"
-        prompt = f"{SYSTEM_PROMPT}\n### HISTORY ###\n{formatted_history}\n### CONTEXT ###\n{context}\n### QUESTION ###\n{question}"
-        response = genai_client.models.generate_content(
-            model=llm_model_name,
-            contents={"text": prompt},
-        )
-        return response.text.strip()
-# === Main Interface Logic ===
-def get_context_and_answer(message, history, session_id="default"):
-    # Reset timer for new request
     timer.reset()
     error_step = None
     notes = []
     try:
-        # Create session config
-        config = create_session_config(session_id)
         # Step 1: Intent Classification
         intent, direct_response = intent_classifier.classify_intent(message)
         # Step 2: Memory Retrieval
-        chat_history = retrieve_memory(config)
         answer = ""
         source_ids = "N/A"
         knowledge_pairs = []
-        if intent != 'query':
             answer = direct_response
             notes.append(f"Simple intent: {intent}")
-        else:
             if len(message.strip()) < 3:
                 answer = "I'd be happy to help! Could you please provide more details about what you'd like to know?"
                 notes.append("Message too short")
@@ -402,17 +89,19 @@ def get_context_and_answer(message, history, session_id="default"):
                     # Step 3: RAG Retrieval
                     with timer.time_step("rag_retrieval"):
                         queried_results = retriever.invoke(message)
                     # Step 4: Embedding Generation
                     query_embedding, doc_embeddings = generate_embeddings(
                         message, queried_results, timer
                     )
                     # Step 5: Similarity Calculation
                     with timer.time_step("similarity_calculation"):
                         cosine_scores = util.cos_sim(
-                            torch.tensor(query_embedding).float(),
-                            torch.tensor(doc_embeddings).float()
                         )[0].tolist()
                         max_score = max(cosine_scores) if cosine_scores else 0
@@ -421,8 +110,10 @@ def get_context_and_answer(message, history, session_id="default"):
                         notes.append(f"Low similarity score: {max_score:.3f}")
                     else:
                         # Step 6: Context Processing
-                        context, source_ids_list, knowledge_pairs = process_context(queried_results, cosine_scores)
                         # Step 7: LLM Generation
                         answer = generate_xeno_response(context, message, chat_history)
                         source_ids = ", ".join(source_ids_list)
@@ -436,126 +127,44 @@ def get_context_and_answer(message, history, session_id="default"):
                     notes.append(f"Error: {str(e)}")
         # Step 8: Memory Update
-        update_memory(config, message, answer)
         # Step 9: Response Logging
         log_response(message, answer, source_ids, knowledge_pairs, session_id)
         # Log timing data
         timing_summary = timer.get_timing_summary()
         log_timing_data(
-            message,
-            session_id,
-            timing_summary,
             error_step=error_step,
-            notes="; ".join(notes) if notes else None
         )
         return answer
     except Exception as e:
         error_step = timer.current_step or "main_pipeline"
         logging.error(f"Error in main pipeline: {e}")
         logging.error(traceback.format_exc())
         timing_summary = timer.get_timing_summary()
         log_timing_data(
-            message,
-            session_id,
-            timing_summary,
             error_step=error_step,
-            notes=f"Pipeline error: {str(e)}"
         )
-        return "I apologize, but I encountered an error processing your request. Please try again."
-# === Enhanced Gradio UI ===
-def respond(message: str, history: List, session_id: str):
-    """Gradio's main response function"""
-    if not session_id:
-        session_id = str(uuid.uuid4())
-    bot_response = get_context_and_answer(message, history, session_id)
-    history.append([message, bot_response])
-    return "", history
-def create_interface():
-    """Create Gradio interface"""
-    with gr.Blocks(theme=gr.themes.Soft()) as demo:
-        gr.Markdown("""
-        # ASKXENO
-        **Welcome to XENO AI Support!**
-        I can help you with questions about XENO financial services including:
-        - Account management and setup
-        - Transaction processes and fees
-        - Platform features and troubleshooting
-        - General service information
-        *Simply type your question below to get started!*
-        """)
-        # Hidden state for session
-        session_id_box = gr.Textbox(label="Session ID", value=str(uuid.uuid4()), visible=False)
-        chatbot = gr.Chatbot(
-            label="XENO Assistant",
-            bubble_full_width=False,
-            height=450
-        )
-        with gr.Row():
-            msg = gr.Textbox(
-                label="Your Message",
-                placeholder="Type your question here...",
-                scale=4,
-            )
-            send_button = gr.Button("Send", variant="primary", scale=1)
-        # ===== FEEDBACK SECTION =====
-        with gr.Row():
-            with gr.Accordion("Rate this response / Flag Issue", open=False):
-                with gr.Row():
-                    thumbs_up = gr.Button("👍 Good Answer")
-                    thumbs_down = gr.Button("👎 Bad / Flag")
-                feedback_reason = gr.Textbox(
-                    label="Reason ",
-                    placeholder="E.g., Incorrect fees, hallucination,"
-                )
-                feedback_status = gr.Label(value="", label="Status", show_label=False)
-        # Feedback Event Listeners
-        # Logic: If Thumbs Up is clicked, send 'Positive'. If Textbox is empty, reason defaults to "Good".
-        thumbs_up.click(
-            fn=lambda h, s, r: submit_feedback("Positive", r if r else "Good", h, s),
-            inputs=[chatbot, session_id_box, feedback_reason],
-            outputs=[feedback_status]
-        )
-        # Logic: If Thumbs Down is clicked, send 'Negative' with the content of the textbox.
-        thumbs_down.click(
-            fn=lambda r, h, s: submit_feedback("Negative", r, h, s),
-            inputs=[feedback_reason, chatbot, session_id_box],
-            outputs=[feedback_status]
-        )
-        # =============================
-        # Chat Event Listeners
-        send_button.click(respond, [msg, chatbot, session_id_box], [msg, chatbot])
-        msg.submit(respond, [msg, chatbot, session_id_box], [msg, chatbot])
-    return demo
 if __name__ == "__main__":
-    iface = create_interface()
     iface.launch(
-        share=False,
-        server_name=SERVER_NAME,
-        server_port=SERVER_PORT,
-        ssr_mode=False
-    )

 XENO Bot - AI-powered customer service assistant
 Main application file with Gradio interface
 """
 import logging
+import os
 import traceback
+from src.config import (COLLECTION_NAME, EMBEDDING_MODEL, LLM_MODEL_NAME,
+                        SERVER_NAME, SERVER_PORT, SIMILARITY_THRESHOLD)
 from src.intent_classifier import IntentClassifier
+from src.interface import create_interface
+from src.knowledge_base import get_knowledge_base_data
 from src.logger import log_response, log_timing_data
+from src.memory import create_session_config, retrieve_memory, update_memory
+from src.response_generator import generate_xeno_response
+# Import custom modules
+from src.utils import PipelineTimer
+from src.vector_store import (generate_embeddings, initialize_vector_store,
+                              process_context)
 # === Configuration ===
 # Ensure API Key is set
     print("WARNING: GEMINI_API_KEY environment variable not found.")
 # Initialize the client
+embedding_model = EMBEDDING_MODEL
+llm_model_name = LLM_MODEL_NAME
+collection_name = COLLECTION_NAME
 # === Intent Classification System ===
 intent_classifier = IntentClassifier()
 # === Load and Clean Knowledge Base ===
+documents, metadatas, ids = get_knowledge_base_data()
 # === Setup ChromaDB ===
+collection, vector_store, retriever = initialize_vector_store()
+# === Core Orchestration Logic ===
+def get_context_and_answer(
+    message, history, session_id, intent_classifier, retriever
+):
+    """
+    Core orchestration function that handles the RAG pipeline
+    Args:
+        message: User's message
+        history: Chat history
+        session_id: Session identifier
+        intent_classifier: IntentClassifier instance
+        retriever: Vector store retriever instance
+    Returns:
+        Generated answer string
+    """
+    # Create timer per session
+    timer = PipelineTimer()
     timer.reset()
     error_step = None
     notes = []
     try:
+        # Create session memory config
+        memory_config = create_session_config(session_id)
         # Step 1: Intent Classification
         intent, direct_response = intent_classifier.classify_intent(message)
         # Step 2: Memory Retrieval
+        chat_history = retrieve_memory(memory_config)
         answer = ""
         source_ids = "N/A"
         knowledge_pairs = []
+        if intent != "query":
             answer = direct_response
             notes.append(f"Simple intent: {intent}")
+        else:
             if len(message.strip()) < 3:
                 answer = "I'd be happy to help! Could you please provide more details about what you'd like to know?"
                 notes.append("Message too short")
                     # Step 3: RAG Retrieval
                     with timer.time_step("rag_retrieval"):
                         queried_results = retriever.invoke(message)
                     # Step 4: Embedding Generation
                     query_embedding, doc_embeddings = generate_embeddings(
                         message, queried_results, timer
                     )
                     # Step 5: Similarity Calculation
                     with timer.time_step("similarity_calculation"):
+                        import sentence_transformers.util as util
+                        import torch
                         cosine_scores = util.cos_sim(
+                            torch.tensor(query_embedding).float(),
+                            torch.tensor(doc_embeddings).float(),
                         )[0].tolist()
                         max_score = max(cosine_scores) if cosine_scores else 0
                         notes.append(f"Low similarity score: {max_score:.3f}")
                     else:
                         # Step 6: Context Processing
+                        context, source_ids_list, knowledge_pairs = process_context(
+                            queried_results, cosine_scores
+                        )
                         # Step 7: LLM Generation
                         answer = generate_xeno_response(context, message, chat_history)
                         source_ids = ", ".join(source_ids_list)
                     notes.append(f"Error: {str(e)}")
         # Step 8: Memory Update
+        update_memory(memory_config, message, answer)
         # Step 9: Response Logging
         log_response(message, answer, source_ids, knowledge_pairs, session_id)
         # Log timing data
         timing_summary = timer.get_timing_summary()
         log_timing_data(
+            message,
+            session_id,
+            timing_summary,
             error_step=error_step,
+            notes="; ".join(notes) if notes else None,
         )
         return answer
     except Exception as e:
         error_step = timer.current_step or "main_pipeline"
         logging.error(f"Error in main pipeline: {e}")
         logging.error(traceback.format_exc())
         timing_summary = timer.get_timing_summary()
         log_timing_data(
+            message,
+            session_id,
+            timing_summary,
             error_step=error_step,
+            notes=f"Pipeline error: {str(e)}",
         )
+        return "I apologize, but I encountered an error processing your request. Please try again."
+# === Main Interface Logic ===
 if __name__ == "__main__":
+    iface = create_interface(intent_classifier, retriever)
     iface.launch(
+        share=False, server_name=SERVER_NAME, server_port=SERVER_PORT, ssr_mode=False
+    )

docker-compose.yml CHANGED Viewed

@@ -1,5 +1,6 @@
 services:
   xeno-bot:
     build:
       context: .
       dockerfile: Dockerfile

 services:
   xeno-bot:
+    image: rogerzmukiibi/xeno-bot:test_v1
     build:
       context: .
       dockerfile: Dockerfile

requirements.txt CHANGED Viewed

@@ -2,7 +2,7 @@ huggingface_hub==0.25.2
 gradio
 pydantic==2.10.6
 pandas
-torch==2.3.1
 numpy
 sentence-transformers
 google-genai

 gradio
 pydantic==2.10.6
 pandas
+torch>=2.3.1
 numpy
 sentence-transformers
 google-genai

src/config.py CHANGED Viewed

@@ -2,7 +2,9 @@
 Configuration module for XENO Bot
 Handles environment variables and application settings
 """
 import os
 from google import genai
 # === API Configuration ===
@@ -11,7 +13,7 @@ if not GEMINI_API_KEY:
     raise ValueError("GEMINI_API_KEY environment variable not set.")
 # Initialize the genai client
-client = genai.Client(api_key=GEMINI_API_KEY)
 # === Model Configuration ===
 EMBEDDING_MODEL = "text-embedding-004"
@@ -30,6 +32,7 @@ GOOGLE_SHEETS_CREDENTIALS_ENV = "GOOGLE_SHEETS_CREDENTIALS"
 SPREADSHEET_NAME = "Response_Log"
 RESPONSE_SHEET_INDEX = 0  # sheet1
 TIMING_SHEET_NAME = "Timing_Log"
 # === RAG Configuration ===
 RAG_TOP_K = 4

 Configuration module for XENO Bot
 Handles environment variables and application settings
 """
 import os
 from google import genai
 # === API Configuration ===
     raise ValueError("GEMINI_API_KEY environment variable not set.")
 # Initialize the genai client
+genai_client = genai.Client(api_key=GEMINI_API_KEY)
 # === Model Configuration ===
 EMBEDDING_MODEL = "text-embedding-004"
 SPREADSHEET_NAME = "Response_Log"
 RESPONSE_SHEET_INDEX = 0  # sheet1
 TIMING_SHEET_NAME = "Timing_Log"
+FEEDBACK_SHEET_NAME = "Feedback_Log"
 # === RAG Configuration ===
 RAG_TOP_K = 4

src/intent_classifier.py CHANGED Viewed

@@ -2,62 +2,63 @@
 Intent Classification module for XENO Bot
 Handles classification of user intents (greetings, thanks, goodbye, queries)
 """
-import re
 import random
-from typing import Tuple, List
 class IntentClassifier:
     """Classifies user intents and provides appropriate responses"""
     def __init__(self):
         self.intent_patterns = {
-            'greeting': {
-                'patterns': [
-                    r'\b(hi|hello|hey|good morning|good afternoon|good evening|greetings)\b',
-                    r'^(hi|hello|hey)[\s!.]*$',
-                    r'\b(how are you|how do you do)\b'
                 ],
-                'responses': [
                     "Hello! I'm XENO Assistant. How can I help you with XENO financial services today?",
                     "Hi there! I'm here to assist you with any questions about XENO services. What can I help you with?",
-                    "Good day! Welcome to XENO Support. How may I assist you today?"
-                ]
             },
-            'thanks': {
-                'patterns': [
-                    r'\b(thank you|thanks|thank u|thx|appreciate|grateful)\b',
-                    r'^(thanks|thank you)[\s!.]*$',
-                    r'\b(much appreciated|thanks a lot|thank you so much)\b'
                 ],
-                'responses': [
                     "You're welcome! Is there anything else I can help you with regarding XENO services?",
                     "Happy to help! Feel free to ask if you have any other questions about XENO.",
-                    "Glad I could assist you! Let me know if you need help with anything else."
-                ]
             },
-            'goodbye': {
-                'patterns': [
-                    r'\b(bye|goodbye|see you|farewell|take care|have a good day)\b',
-                    r'^(bye|goodbye)[\s!.]*$',
-                    r'\b(talk to you later|see you later|until next time)\b'
                 ],
-                'responses': [
                     "Goodbye! Thank you for using XENO services. Have a great day!",
                     "Take care! Feel free to return anytime you need help with XENO services.",
-                    "Have a wonderful day! Don't hesitate to reach out if you need assistance with XENO."
-                ]
-            }
         }
     def classify_intent(self, message: str, timer=None) -> Tuple[str, str]:
         """
         Classify the intent of a user message
         Args:
             message: User's message
             timer: Optional timer object for tracking
         Returns:
             Tuple of (intent_name, response_text)
         """
@@ -66,42 +67,42 @@ class IntentClassifier:
                 return self._classify_intent_impl(message)
         else:
             return self._classify_intent_impl(message)
     def _classify_intent_impl(self, message: str) -> Tuple[str, str]:
         """Internal implementation of intent classification"""
         message_lower = message.lower().strip()
         for intent_name, intent_data in self.intent_patterns.items():
-            for pattern in intent_data['patterns']:
                 if re.search(pattern, message_lower, re.IGNORECASE):
-                    response = random.choice(intent_data['responses'])
                     return intent_name, response
-        return 'query', ''
     def is_simple_intent(self, intent: str) -> bool:
         """
         Check if the intent is a simple one that doesn't require RAG
         Args:
             intent: Intent name
         Returns:
             True if simple intent, False otherwise
         """
-        simple_intents = ['greeting', 'thanks']
         return intent in simple_intents
     def add_intent(self, intent_name: str, patterns: List[str], responses: List[str]):
         """
         Add a new intent to the classifier
         Args:
             intent_name: Name of the intent
             patterns: List of regex patterns to match
             responses: List of possible responses
         """
         self.intent_patterns[intent_name] = {
-            'patterns': patterns,
-            'responses': responses
         }

 Intent Classification module for XENO Bot
 Handles classification of user intents (greetings, thanks, goodbye, queries)
 """
 import random
+import re
+from typing import List, Tuple
 class IntentClassifier:
     """Classifies user intents and provides appropriate responses"""
     def __init__(self):
         self.intent_patterns = {
+            "greeting": {
+                "patterns": [
+                    r"\b(hi|hello|hey|good morning|good afternoon|good evening|greetings)\b",
+                    r"^(hi|hello|hey)[\s!.]*$",
+                    r"\b(how are you|how do you do)\b",
                 ],
+                "responses": [
                     "Hello! I'm XENO Assistant. How can I help you with XENO financial services today?",
                     "Hi there! I'm here to assist you with any questions about XENO services. What can I help you with?",
+                    "Good day! Welcome to XENO Support. How may I assist you today?",
+                ],
             },
+            "thanks": {
+                "patterns": [
+                    r"\b(thank you|thanks|thank u|thx|appreciate|grateful)\b",
+                    r"^(thanks|thank you)[\s!.]*$",
+                    r"\b(much appreciated|thanks a lot|thank you so much)\b",
                 ],
+                "responses": [
                     "You're welcome! Is there anything else I can help you with regarding XENO services?",
                     "Happy to help! Feel free to ask if you have any other questions about XENO.",
+                    "Glad I could assist you! Let me know if you need help with anything else.",
+                ],
             },
+            "goodbye": {
+                "patterns": [
+                    r"\b(bye|goodbye|see you|farewell|take care|have a good day)\b",
+                    r"^(bye|goodbye)[\s!.]*$",
+                    r"\b(talk to you later|see you later|until next time)\b",
                 ],
+                "responses": [
                     "Goodbye! Thank you for using XENO services. Have a great day!",
                     "Take care! Feel free to return anytime you need help with XENO services.",
+                    "Have a wonderful day! Don't hesitate to reach out if you need assistance with XENO.",
+                ],
+            },
         }
     def classify_intent(self, message: str, timer=None) -> Tuple[str, str]:
         """
         Classify the intent of a user message
         Args:
             message: User's message
             timer: Optional timer object for tracking
         Returns:
             Tuple of (intent_name, response_text)
         """
                 return self._classify_intent_impl(message)
         else:
             return self._classify_intent_impl(message)
     def _classify_intent_impl(self, message: str) -> Tuple[str, str]:
         """Internal implementation of intent classification"""
         message_lower = message.lower().strip()
         for intent_name, intent_data in self.intent_patterns.items():
+            for pattern in intent_data["patterns"]:
                 if re.search(pattern, message_lower, re.IGNORECASE):
+                    response = random.choice(intent_data["responses"])
                     return intent_name, response
+        return "query", ""
     def is_simple_intent(self, intent: str) -> bool:
         """
         Check if the intent is a simple one that doesn't require RAG
         Args:
             intent: Intent name
         Returns:
             True if simple intent, False otherwise
         """
+        simple_intents = ["greeting", "thanks"]
         return intent in simple_intents
     def add_intent(self, intent_name: str, patterns: List[str], responses: List[str]):
         """
         Add a new intent to the classifier
         Args:
             intent_name: Name of the intent
             patterns: List of regex patterns to match
             responses: List of possible responses
         """
         self.intent_patterns[intent_name] = {
+            "patterns": patterns,
+            "responses": responses,
         }

src/interface.py ADDED Viewed

	@@ -0,0 +1,121 @@

+import uuid
+from typing import List
+import gradio as gr
+from src.logger import log_feedback
+def respond(
+    message: str, history: List, session_id: str, intent_classifier, retriever
+):
+    """
+    Gradio's main response function
+    Args:
+        message: User's message
+        history: Chat history
+        session_id: Session identifier
+        intent_classifier: IntentClassifier instance
+        retriever: Vector store retriever instance
+    Returns:
+        Tuple of (empty string for input box, updated history)
+    """
+    # Import here to avoid circular imports
+    from app import get_context_and_answer
+    if not session_id:
+        session_id = str(uuid.uuid4())
+    bot_response = get_context_and_answer(
+        message, history, session_id, intent_classifier, retriever
+    )
+    history.append([message, bot_response])
+    return "", history
+def create_interface(intent_classifier, retriever):
+    """
+    Create Gradio interface
+    Args:
+        intent_classifier: IntentClassifier instance
+        retriever: Vector store retriever instance
+    Returns:
+        Gradio Blocks interface
+    """
+    with gr.Blocks(theme=gr.themes.Soft()) as demo:
+        gr.Markdown("""
+        # ASKXENO
+        **Welcome to XENO AI Support!**
+        I can help you with questions about XENO financial services including:
+        - Account management and setup
+        - Transaction processes and fees
+        - Platform features and troubleshooting
+        - General service information
+        *Simply type your question below to get started!*
+        """)
+        # Hidden state for session
+        session_id_box = gr.Textbox(
+            label="Session ID", value=str(uuid.uuid4()), visible=False
+        )
+        chatbot = gr.Chatbot(
+            label="XENO Assistant", bubble_full_width=False, height=450
+        )
+        with gr.Row():
+            msg = gr.Textbox(
+                label="Your Message",
+                placeholder="Type your question here...",
+                scale=4,
+            )
+            send_button = gr.Button("Send", variant="primary", scale=1)
+        # ===== FEEDBACK SECTION =====
+        with gr.Row():
+            with gr.Accordion("Rate this response / Flag Issue", open=False):
+                with gr.Row():
+                    thumbs_up = gr.Button("👍 Good Answer")
+                    thumbs_down = gr.Button("👎 Bad / Flag")
+                feedback_reason = gr.Textbox(
+                    label="Reason ", placeholder="E.g., Incorrect fees, hallucination,"
+                )
+                feedback_status = gr.Label(value="", label="Status", show_label=False)
+        # Feedback Event Listeners
+        # Logic: If Thumbs Up is clicked, send 'Positive'. If Textbox is empty, reason defaults to "Good".
+        thumbs_up.click(
+            fn=lambda h, s, r: log_feedback("Positive", r if r else "Good", h, s),
+            inputs=[chatbot, session_id_box, feedback_reason],
+            outputs=[feedback_status],
+        )
+        # Logic: If Thumbs Down is clicked, send 'Negative' with the content of the textbox.
+        thumbs_down.click(
+            fn=lambda r, h, s: log_feedback("Negative", r, h, s),
+            inputs=[feedback_reason, chatbot, session_id_box],
+            outputs=[feedback_status],
+        )
+        # =============================
+        # Chat Event Listeners - Pass components to respond function
+        send_button.click(
+            lambda msg, chat, sid: respond(msg, chat, sid, intent_classifier, retriever),
+            [msg, chatbot, session_id_box],
+            [msg, chatbot],
+        )
+        msg.submit(
+            lambda msg, chat, sid: respond(msg, chat, sid, intent_classifier, retriever),
+            [msg, chatbot, session_id_box],
+            [msg, chatbot],
+        )
+    return demo

src/knowledge_base.py CHANGED Viewed

@@ -2,68 +2,80 @@
 Knowledge Base module for XENO Bot
 Handles loading and preparing knowledge base data
 """
 import pandas as pd
-from typing import List, Dict, Tuple, Any
 from src.config import KNOWLEDGE_BASE_PATH
 def load_knowledge_base(filepath: str = KNOWLEDGE_BASE_PATH) -> pd.DataFrame:
     """
     Load knowledge base from JSON file
     Args:
         filepath: Path to the knowledge base JSON file
     Returns:
         DataFrame with knowledge base data
     """
-    df = pd.read_json(filepath)
-    df.dropna(subset=['Content'], inplace=True)
     return df
-def prepare_documents(data: List[Dict[str, Any]]) -> Tuple[List[str], List[Dict], List[str]]:
     """
     Prepare documents for vector store
     Args:
         data: List of knowledge base entries
     Returns:
         Tuple of (documents, metadatas, ids)
     """
     documents, metadatas, ids = [], [], []
-    for item in data:
-        # Create document text with question and answer
-        document_text = f"Question: {item['Question']}\nAnswer: {item['Content']}"
-        documents.append(document_text)
-        # Create metadata
-        metadata = {
-            "question": item["Question"],
-            "content": item["Content"],
-            "section": item.get("Section", ""),
-            "source": item.get("Source", ""),
-            "owner": item.get("Owner", ""),
-            "tag": item.get("Tag", ""),
-            "id": item["ID"]
-        }
-        metadatas.append(metadata)
-        # Add ID
-        ids.append(item["ID"])
     return documents, metadatas, ids
 def get_knowledge_base_data() -> Tuple[List[str], List[Dict], List[str]]:
     """
     Load and prepare knowledge base data
     Returns:
         Tuple of (documents, metadatas, ids)
     """
     df = load_knowledge_base()
-    data_list = df.to_dict('records')
     return prepare_documents(data_list)

 Knowledge Base module for XENO Bot
 Handles loading and preparing knowledge base data
 """
+from typing import Any, Dict, Hashable, List, Tuple
 import pandas as pd
 from src.config import KNOWLEDGE_BASE_PATH
 def load_knowledge_base(filepath: str = KNOWLEDGE_BASE_PATH) -> pd.DataFrame:
     """
     Load knowledge base from JSON file
     Args:
         filepath: Path to the knowledge base JSON file
     Returns:
         DataFrame with knowledge base data
     """
+    try:
+        df = pd.read_json(filepath)
+        df.dropna(subset=["Content"], inplace=True)
+    except Exception as e:
+        print(f"Error loading knowledge base: {e}")
+        df = pd.DataFrame()
     return df
+def prepare_documents(
+    data: List[Dict[Hashable, Any]],
+) -> Tuple[List[str], List[Dict], List[str]]:
     """
     Prepare documents for vector store
     Args:
         data: List of knowledge base entries
     Returns:
         Tuple of (documents, metadatas, ids)
     """
     documents, metadatas, ids = [], [], []
+    try:
+        for item in data:
+            # Create document text with question and answer
+            document_text = f"Question: {item['Question']}\nAnswer: {item['Content']}"
+            documents.append(document_text)
+            # Create metadata
+            metadata = {
+                "question": item["Question"],
+                "content": item["Content"],
+                "section": item.get("Section", ""),
+                "source": item.get("Source", ""),
+                "owner": item.get("Owner", ""),
+                "tag": item.get("Tag", ""),
+                "id": item["ID"],
+            }
+            metadatas.append(metadata)
+            # Add ID
+            ids.append(item["ID"])
+    except KeyError as e:
+        print(f"Missing expected key in data item: {e}")
     return documents, metadatas, ids
 def get_knowledge_base_data() -> Tuple[List[str], List[Dict], List[str]]:
     """
     Load and prepare knowledge base data
     Returns:
         Tuple of (documents, metadatas, ids)
     """
     df = load_knowledge_base()
+    data_list = df.to_dict("records")
     return prepare_documents(data_list)

src/logger.py CHANGED Viewed

@@ -2,81 +2,145 @@
 Logging module for XENO Bot
 Handles Google Sheets logging for responses and timing data
 """
 import json
 import os
 from datetime import datetime
-from typing import List, Tuple, Dict, Optional
 import gspread
 from google.oauth2.service_account import Credentials
-from src.config import (
-    GOOGLE_SHEETS_CREDENTIALS_ENV,
-    SPREADSHEET_NAME,
-    RESPONSE_SHEET_INDEX,
-    TIMING_SHEET_NAME
-)
 def get_google_sheets_credentials() -> Credentials:
     """
     Get Google Sheets credentials from environment variable
     Returns:
         Google Sheets credentials object
     """
     credentials_json = os.environ.get(GOOGLE_SHEETS_CREDENTIALS_ENV)
     if not credentials_json:
-        raise ValueError(f"{GOOGLE_SHEETS_CREDENTIALS_ENV} environment variable not set.")
     credentials_dict = json.loads(credentials_json)
     scope = [
-        "https://spreadsheets.google.com/feeds",
-        "https://www.googleapis.com/auth/drive"
     ]
     creds = Credentials.from_service_account_info(credentials_dict, scopes=scope)
     return creds
 def initialize_sheets():
     """
     Initialize Google Sheets client and get sheets
     Returns:
         Tuple of (response_sheet, timing_sheet)
     """
-    client_gspread = gspread.authorize(get_google_sheets_credentials())
-    spreadsheet = client_gspread.open(SPREADSHEET_NAME)
-    # Get response sheet
-    response_sheet = spreadsheet.get_worksheet(RESPONSE_SHEET_INDEX)
     # Get or create timing sheet
     try:
         timing_sheet = spreadsheet.worksheet(TIMING_SHEET_NAME)
     except:
         # Create timing sheet if it doesn't exist
-        timing_sheet = spreadsheet.add_worksheet(title=TIMING_SHEET_NAME, rows="1000", cols="15")
-        # Add headers
-        headers = [
-            "Timestamp", "Session_ID", "Question", "Total_Time_MS",
-            "Intent_Classification_MS", "Memory_Retrieval_MS", "RAG_Retrieval_MS",
-            "Embedding_Generation_MS", "Similarity_Calculation_MS", "Context_Processing_MS",
-            "LLM_Generation_MS", "Memory_Update_MS", "Logging_MS", "Error_Step", "Notes"
-        ]
-        timing_sheet.append_row(headers)
-    return response_sheet, timing_sheet
 # Initialize sheets
-response_sheet, timing_sheet = initialize_sheets()
-def log_response(question: str, answer: str, source_ids: str,
-                knowledge_pairs: List[Tuple[str, str]], session_id: str, timer=None):
     """
     Log response to Google Sheets
     Args:
         question: User's question
         answer: Generated answer
@@ -87,28 +151,41 @@ def log_response(question: str, answer: str, source_ids: str,
     """
     if timer:
         with timer.time_step("response_logging"):
-            _log_response_impl(question, answer, source_ids, knowledge_pairs, session_id)
     else:
         _log_response_impl(question, answer, source_ids, knowledge_pairs, session_id)
-def _log_response_impl(question: str, answer: str, source_ids: str,
-                       knowledge_pairs: List[Tuple[str, str]], session_id: str):
     """Internal implementation of response logging"""
     timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
     # Extract knowledge pairs
     knowledge_question_1 = knowledge_pairs[0][0] if len(knowledge_pairs) > 0 else "N/A"
     knowledge_answer_1 = knowledge_pairs[0][1] if len(knowledge_pairs) > 0 else "N/A"
     knowledge_question_2 = knowledge_pairs[1][0] if len(knowledge_pairs) > 1 else "N/A"
     knowledge_answer_2 = knowledge_pairs[1][1] if len(knowledge_pairs) > 1 else "N/A"
     row = [
-        timestamp, session_id, question, answer, source_ids,
-        knowledge_question_1, knowledge_answer_1,
-        knowledge_question_2, knowledge_answer_2
     ]
     try:
         response_sheet.append_row(row)
         print(f"Logged response: {question} | Source IDs: {source_ids}")
@@ -116,14 +193,21 @@ def _log_response_impl(question: str, answer: str, source_ids: str,
         print(f"Failed to log to Google Sheet: {e}")
         # Fallback to local file
         with open("/tmp/response_log.txt", "a") as f:
-            f.write(f"{timestamp},{question},{answer},{source_ids},{knowledge_question_1},{knowledge_answer_1},{knowledge_question_2},{knowledge_answer_2}\n")
-def log_timing_data(question: str, session_id: str, timing_summary: Dict,
-                    error_step: Optional[str] = None, notes: Optional[str] = None):
     """
     Log timing data to Google Sheets
     Args:
         question: User's question
         session_id: Session identifier
@@ -132,29 +216,29 @@ def log_timing_data(question: str, session_id: str, timing_summary: Dict,
         notes: Additional notes
     """
     timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
-    step_times = timing_summary['step_times']
     # Truncate long questions
     truncated_question = question[:100] + "..." if len(question) > 100 else question
     row = [
         timestamp,
         session_id,
         truncated_question,
-        timing_summary['total_time_ms'],
-        step_times.get('intent_classification', 0),
-        step_times.get('memory_retrieval', 0),
-        step_times.get('rag_retrieval', 0),
-        step_times.get('embedding_generation', 0),
-        step_times.get('similarity_calculation', 0),
-        step_times.get('context_processing', 0),
-        step_times.get('llm_generation', 0),
-        step_times.get('memory_update', 0),
-        step_times.get('response_logging', 0),
         error_step or "",
-        notes or ""
     ]
     try:
         timing_sheet.append_row(row)
         print(f"Logged timing data: Total {timing_summary['total_time_ms']}ms")
@@ -163,3 +247,46 @@ def log_timing_data(question: str, session_id: str, timing_summary: Dict,
         # Fallback to local file
         with open("/tmp/timing_log.txt", "a") as f:
             f.write(f"{timestamp},{session_id},{question},{timing_summary}\n")

 Logging module for XENO Bot
 Handles Google Sheets logging for responses and timing data
 """
 import json
 import os
+import threading
 from datetime import datetime
+from typing import Dict, List, Optional, Tuple
 import gspread
 from google.oauth2.service_account import Credentials
+from src.config import (FEEDBACK_SHEET_NAME, GOOGLE_SHEETS_CREDENTIALS_ENV,
+                        RESPONSE_SHEET_INDEX, SPREADSHEET_NAME,
+                        TIMING_SHEET_NAME)
 def get_google_sheets_credentials() -> Credentials:
     """
     Get Google Sheets credentials from environment variable
     Returns:
         Google Sheets credentials object
     """
     credentials_json = os.environ.get(GOOGLE_SHEETS_CREDENTIALS_ENV)
     if not credentials_json:
+        raise ValueError(
+            f"{GOOGLE_SHEETS_CREDENTIALS_ENV} environment variable not set."
+        )
     credentials_dict = json.loads(credentials_json)
     scope = [
+        "https://spreadsheets.google.com/feeds",
+        "https://www.googleapis.com/auth/drive",
     ]
     creds = Credentials.from_service_account_info(credentials_dict, scopes=scope)
     return creds
 def initialize_sheets():
     """
     Initialize Google Sheets client and get sheets
     Returns:
         Tuple of (response_sheet, timing_sheet)
     """
+    try:
+        client_gspread = gspread.authorize(get_google_sheets_credentials())
+        spreadsheet = client_gspread.open(SPREADSHEET_NAME)
+        # Get response sheet
+        response_sheet = spreadsheet.get_worksheet(RESPONSE_SHEET_INDEX)
+    except Exception as e:
+        print(f"Failed to initialize Google Sheets: {e}")
+        # TODO Create dummy sheets or handle error appropriately
+        class DummySheet:
+            def append_row(self, *args, **kwargs):
+                pass
+            def worksheet(self, *args):
+                return self
+            def add_worksheet(self, *args, **kwargs):
+                return self
+        spreadsheet = DummySheet()
+        response_sheet = DummySheet()
     # Get or create timing sheet
     try:
         timing_sheet = spreadsheet.worksheet(TIMING_SHEET_NAME)
     except:
         # Create timing sheet if it doesn't exist
+        try:
+            timing_sheet = spreadsheet.add_worksheet(
+                title=TIMING_SHEET_NAME, rows=1000, cols=15
+            )
+            # Add headers
+            headers = [
+                "Timestamp",
+                "Session_ID",
+                "Question",
+                "Total_Time_MS",
+                "Intent_Classification_MS",
+                "Memory_Retrieval_MS",
+                "RAG_Retrieval_MS",
+                "Embedding_Generation_MS",
+                "Similarity_Calculation_MS",
+                "Context_Processing_MS",
+                "LLM_Generation_MS",
+                "Memory_Update_MS",
+                "Logging_MS",
+                "Error_Step",
+                "Notes",
+            ]
+            timing_sheet.append_row(headers)
+        except Exception as e:
+            print(f"Failed to create timing sheet: {e}")
+            timing_sheet = DummySheet()
+    # Feedback Sheet
+    try:
+        feedback_sheet = spreadsheet.worksheet(FEEDBACK_SHEET_NAME)
+    except:
+        try:
+            feedback_sheet = spreadsheet.add_worksheet(
+                title=FEEDBACK_SHEET_NAME, rows=1000, cols=6
+            )
+            headers = [
+                "Timestamp",
+                "Session_ID",
+                "User_Message",
+                "Bot_Response",
+                "Rating",
+                "Flag_Reason",
+            ]
+            feedback_sheet.append_row(headers)
+        except Exception as e:
+            print(f"Failed to create feedback sheet: {e}")
+            feedback_sheet = DummySheet()
+    return response_sheet, timing_sheet, feedback_sheet
 # Initialize sheets
+response_sheet, timing_sheet, feedback_sheet = initialize_sheets()
+def log_response(
+    question: str,
+    answer: str,
+    source_ids: str,
+    knowledge_pairs: List[Tuple[str, str]],
+    session_id: str,
+    timer=None,
+):
     """
     Log response to Google Sheets
     Args:
         question: User's question
         answer: Generated answer
     """
     if timer:
         with timer.time_step("response_logging"):
+            _log_response_impl(
+                question, answer, source_ids, knowledge_pairs, session_id
+            )
     else:
         _log_response_impl(question, answer, source_ids, knowledge_pairs, session_id)
+def _log_response_impl(
+    question: str,
+    answer: str,
+    source_ids: str,
+    knowledge_pairs: List[Tuple[str, str]],
+    session_id: str,
+):
     """Internal implementation of response logging"""
     timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
     # Extract knowledge pairs
     knowledge_question_1 = knowledge_pairs[0][0] if len(knowledge_pairs) > 0 else "N/A"
     knowledge_answer_1 = knowledge_pairs[0][1] if len(knowledge_pairs) > 0 else "N/A"
     knowledge_question_2 = knowledge_pairs[1][0] if len(knowledge_pairs) > 1 else "N/A"
     knowledge_answer_2 = knowledge_pairs[1][1] if len(knowledge_pairs) > 1 else "N/A"
     row = [
+        timestamp,
+        session_id,
+        question,
+        answer,
+        source_ids,
+        knowledge_question_1,
+        knowledge_answer_1,
+        knowledge_question_2,
+        knowledge_answer_2,
     ]
     try:
         response_sheet.append_row(row)
         print(f"Logged response: {question} | Source IDs: {source_ids}")
         print(f"Failed to log to Google Sheet: {e}")
         # Fallback to local file
         with open("/tmp/response_log.txt", "a") as f:
+            f.write(
+                f"{timestamp},{question},{answer},{source_ids},{knowledge_question_1},{knowledge_answer_1},{knowledge_question_2},{knowledge_answer_2}\n"
+            )
+def log_timing_data(
+    question: str,
+    session_id: str,
+    timing_summary: Dict,
+    error_step: Optional[str] = None,
+    notes: Optional[str] = None,
+):
     """
     Log timing data to Google Sheets
     Args:
         question: User's question
         session_id: Session identifier
         notes: Additional notes
     """
     timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
+    step_times = timing_summary["step_times"]
     # Truncate long questions
     truncated_question = question[:100] + "..." if len(question) > 100 else question
     row = [
         timestamp,
         session_id,
         truncated_question,
+        timing_summary["total_time_ms"],
+        step_times.get("intent_classification", 0),
+        step_times.get("memory_retrieval", 0),
+        step_times.get("rag_retrieval", 0),
+        step_times.get("embedding_generation", 0),
+        step_times.get("similarity_calculation", 0),
+        step_times.get("context_processing", 0),
+        step_times.get("llm_generation", 0),
+        step_times.get("memory_update", 0),
+        step_times.get("response_logging", 0),
         error_step or "",
+        notes or "",
     ]
     try:
         timing_sheet.append_row(row)
         print(f"Logged timing data: Total {timing_summary['total_time_ms']}ms")
         # Fallback to local file
         with open("/tmp/timing_log.txt", "a") as f:
             f.write(f"{timestamp},{session_id},{question},{timing_summary}\n")
+def _log_feedback_background(row):
+    """Helper to run network request in background thread"""
+    try:
+        if feedback_sheet:
+            feedback_sheet.append_row(row)
+            print("Feedback logged successfully.")
+        else:
+            print("Feedback sheet not available.")
+    except Exception as e:
+        print(f"Failed to log feedback: {e}")
+def log_feedback(rating, reason, history, session_id):
+    """
+    Handles user feedback submission.
+    rating: 'Positive' or 'Negative'
+    reason: User provided text
+    history: Gradio chat history list
+    """
+    if not history or len(history) == 0:
+        return "No conversation to rate yet."
+    # Get the last interaction (Gradio history is a list of lists: [[user, bot], ...])
+    last_interaction = history[-1]
+    # Safety check for history format
+    if isinstance(last_interaction, list) and len(last_interaction) >= 2:
+        user_msg = last_interaction[0]
+        bot_msg = last_interaction[1]
+    else:
+        return "Error reading conversation history."
+    timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
+    # Prepare row data
+    row = [timestamp, session_id, user_msg, bot_msg, rating, reason]
+    # Run in thread to prevent UI blocking
+    threading.Thread(target=_log_feedback_background, args=(row,)).start()
+    return f"Feedback received ({rating}). Thank you!"

src/memory.py CHANGED Viewed

@@ -2,11 +2,14 @@
 Memory module for XENO Bot
 Handles LangGraph memory operations using SQLite
 """
-import uuid
 import sqlite3
 from datetime import datetime
-from typing import List, Dict, Any
 from langgraph.checkpoint.sqlite import SqliteSaver
 from src.config import SQLITE_DB_PATH
 # === LangGraph Memory Setup ===
@@ -14,10 +17,12 @@ conn = sqlite3.connect(SQLITE_DB_PATH, check_same_thread=False)
 memory = SqliteSaver(conn=conn)
-def update_memory(config: Dict[str, Any], user_message: str, assistant_message: str, timer=None):
     """
     Update memory with new messages
     Args:
         config: Configuration dictionary with thread_id
         user_message: User's message
@@ -31,34 +36,34 @@ def update_memory(config: Dict[str, Any], user_message: str, assistant_message:
         _update_memory_impl(config, user_message, assistant_message)
-def _update_memory_impl(config: Dict[str, Any], user_message: str, assistant_message: str):
     """Internal implementation of memory update"""
     full_checkpoint = memory.get(config) or {}
     messages = full_checkpoint.get("channel_values", {}).get("messages", [])
     messages.append({"role": "user", "content": user_message})
     messages.append({"role": "assistant", "content": assistant_message})
     checkpoint_to_save = {
         "v": 1,
         "id": str(uuid.uuid4()),
         "ts": datetime.now().isoformat(),
         "channel_values": {"messages": messages},
         "channel_versions": {},
-        "versions_seen": {},
     }
     memory.put(config, checkpoint_to_save, {}, {})
 def retrieve_memory(config: Dict[str, Any], timer=None) -> List[Dict[str, str]]:
     """
     Retrieve memory messages for a session
     Args:
         config: Configuration dictionary with thread_id
         timer: Optional timer object for tracking
     Returns:
         List of message dictionaries
     """
@@ -69,7 +74,7 @@ def retrieve_memory(config: Dict[str, Any], timer=None) -> List[Dict[str, str]]:
         return _retrieve_memory_impl(config)
-def _retrieve_memory_impl(config: Dict[str, Any]) -> List[Dict[str, str]]:
     """Internal implementation of memory retrieval"""
     full_checkpoint = memory.get(config) or {}
     return full_checkpoint.get("channel_values", {}).get("messages", [])
@@ -78,10 +83,10 @@ def _retrieve_memory_impl(config: Dict[str, Any]) -> List[Dict[str, str]]:
 def create_session_config(session_id: str = "default") -> Dict[str, Any]:
     """
     Create a configuration dictionary for a session
     Args:
         session_id: Unique session identifier
     Returns:
         Configuration dictionary
     """

 Memory module for XENO Bot
 Handles LangGraph memory operations using SQLite
 """
 import sqlite3
+import uuid
 from datetime import datetime
+from typing import Any, Dict, List
 from langgraph.checkpoint.sqlite import SqliteSaver
 from src.config import SQLITE_DB_PATH
 # === LangGraph Memory Setup ===
 memory = SqliteSaver(conn=conn)
+def update_memory(
+    config: Dict[str, Any], user_message: str, assistant_message: str, timer=None
+):
     """
     Update memory with new messages
     Args:
         config: Configuration dictionary with thread_id
         user_message: User's message
         _update_memory_impl(config, user_message, assistant_message)
+def _update_memory_impl(config, user_message: str, assistant_message: str):
     """Internal implementation of memory update"""
     full_checkpoint = memory.get(config) or {}
     messages = full_checkpoint.get("channel_values", {}).get("messages", [])
     messages.append({"role": "user", "content": user_message})
     messages.append({"role": "assistant", "content": assistant_message})
     checkpoint_to_save = {
         "v": 1,
         "id": str(uuid.uuid4()),
         "ts": datetime.now().isoformat(),
         "channel_values": {"messages": messages},
         "channel_versions": {},
+        "versions_seen": {},
     }
     memory.put(config, checkpoint_to_save, {}, {})
 def retrieve_memory(config: Dict[str, Any], timer=None) -> List[Dict[str, str]]:
     """
     Retrieve memory messages for a session
     Args:
         config: Configuration dictionary with thread_id
         timer: Optional timer object for tracking
     Returns:
         List of message dictionaries
     """
         return _retrieve_memory_impl(config)
+def _retrieve_memory_impl(config) -> List[Dict[str, str]]:
     """Internal implementation of memory retrieval"""
     full_checkpoint = memory.get(config) or {}
     return full_checkpoint.get("channel_values", {}).get("messages", [])
 def create_session_config(session_id: str = "default") -> Dict[str, Any]:
     """
     Create a configuration dictionary for a session
     Args:
         session_id: Unique session identifier
     Returns:
         Configuration dictionary
     """

src/response_generator.py CHANGED Viewed

@@ -2,21 +2,24 @@
 Response Generation module for XENO Bot
 Handles LLM response generation
 """
-from google import genai
-from typing import List, Dict
-from src.config import LLM_MODEL_NAME, SYSTEM_PROMPT, client
-def generate_xeno_response(context: str, question: str, chat_history: List[Dict[str, str]], timer=None) -> str:
     """
     Generate a response using the LLM
     Args:
         context: Formatted context from knowledge base
         question: User's question
         chat_history: List of previous messages
         timer: Optional timer object for tracking
     Returns:
         Generated response text
     """
@@ -27,42 +30,47 @@ def generate_xeno_response(context: str, question: str, chat_history: List[Dict[
         return _generate_response_impl(context, question, chat_history)
-def _generate_response_impl(context: str, question: str, chat_history: List[Dict[str, str]]) -> str:
     """Internal implementation of response generation"""
     # Format chat history
-    formatted_history = "\n".join(
-        [f"{msg['role'].capitalize()}: {msg['content']}" for msg in chat_history]
-    ) if chat_history else "None"
     # Build prompt
     prompt = f"{SYSTEM_PROMPT}\n### HISTORY ###\n{formatted_history}\n### CONTEXT ###\n{context}\n### QUESTION ###\n{question}"
     # Generate response
-    response = client.generate_content(
-        model=LLM_MODEL_NAME,
-        contents={"text": prompt}
     )
     return response.text
 def format_chat_history(messages: List[Dict[str, str]]) -> str:
     """
     Format chat history for display or logging
     Args:
         messages: List of message dictionaries with 'role' and 'content'
     Returns:
         Formatted string representation of chat history
     """
     if not messages:
         return "No previous conversation"
     formatted = []
     for msg in messages:
-        role = msg.get('role', 'unknown').capitalize()
-        content = msg.get('content', '')
         formatted.append(f"{role}: {content}")
     return "\n".join(formatted)

 Response Generation module for XENO Bot
 Handles LLM response generation
 """
+from typing import Dict, List
+from src.config import LLM_MODEL_NAME, SYSTEM_PROMPT, genai_client
+def generate_xeno_response(
+    context: str, question: str, chat_history: List[Dict[str, str]], timer=None
+) -> str:
     """
     Generate a response using the LLM
     Args:
         context: Formatted context from knowledge base
         question: User's question
         chat_history: List of previous messages
         timer: Optional timer object for tracking
     Returns:
         Generated response text
     """
         return _generate_response_impl(context, question, chat_history)
+def _generate_response_impl(
+    context: str, question: str, chat_history: List[Dict[str, str]]
+) -> str:
     """Internal implementation of response generation"""
     # Format chat history
+    formatted_history = (
+        "\n".join(
+            [f"{msg['role'].capitalize()}: {msg['content']}" for msg in chat_history]
+        )
+        if chat_history
+        else "None"
+    )
     # Build prompt
     prompt = f"{SYSTEM_PROMPT}\n### HISTORY ###\n{formatted_history}\n### CONTEXT ###\n{context}\n### QUESTION ###\n{question}"
     # Generate response
+    response = genai_client.models.generate_content(
+        model=LLM_MODEL_NAME, contents=prompt
     )
     return response.text
 def format_chat_history(messages: List[Dict[str, str]]) -> str:
     """
     Format chat history for display or logging
     Args:
         messages: List of message dictionaries with 'role' and 'content'
     Returns:
         Formatted string representation of chat history
     """
     if not messages:
         return "No previous conversation"
     formatted = []
     for msg in messages:
+        role = msg.get("role", "unknown").capitalize()
+        content = msg.get("content", "")
         formatted.append(f"{role}: {content}")
     return "\n".join(formatted)

src/utils.py CHANGED Viewed

@@ -2,6 +2,7 @@
 Utilities module for XENO Bot
 Handles logging and timing functionality
 """
 import logging
 import sys
 import time
@@ -13,14 +14,18 @@ from typing import Dict
 logging.basicConfig(
     filename="app.log",
     level=logging.INFO,
-    format="%(asctime)s - %(levelname)s - %(message)s"
 )
 def log_exception(exc_type, exc_value, exc_traceback):
     """Log uncaught exceptions"""
     if issubclass(exc_type, KeyboardInterrupt):
         return
-    logging.critical("Uncaught exception", exc_info=(exc_type, exc_value, exc_traceback))
 sys.excepthook = log_exception
 logging.info("App started successfully.")
@@ -29,17 +34,17 @@ logging.info("App started successfully.")
 # ===== Time Tracking Class =====
 class PipelineTimer:
     """Timer for tracking pipeline execution steps"""
     def __init__(self):
         self.reset()
     def reset(self):
         """Reset all timing data for a new request"""
         self.start_time = time.time()
         self.step_times = {}
         self.step_start = None
         self.current_step = None
     @contextmanager
     def time_step(self, step_name: str):
         """Context manager to time a specific step"""
@@ -49,18 +54,20 @@ class PipelineTimer:
             yield
         finally:
             step_end = time.time()
-            self.step_times[step_name] = round((step_end - step_start) * 1000, 2)  # Convert to milliseconds
             self.current_step = None
     def get_total_time(self):
         """Get total elapsed time since reset"""
         return round((time.time() - self.start_time) * 1000, 2)
     def get_timing_summary(self) -> Dict:
         """Get a summary of all timing data"""
         total_time = self.get_total_time()
         return {
-            'total_time_ms': total_time,
-            'step_times': self.step_times,
-            'timestamp': datetime.now().isoformat()
         }

 Utilities module for XENO Bot
 Handles logging and timing functionality
 """
 import logging
 import sys
 import time
 logging.basicConfig(
     filename="app.log",
     level=logging.INFO,
+    format="%(asctime)s - %(levelname)s - %(message)s",
 )
 def log_exception(exc_type, exc_value, exc_traceback):
     """Log uncaught exceptions"""
     if issubclass(exc_type, KeyboardInterrupt):
         return
+    logging.critical(
+        "Uncaught exception", exc_info=(exc_type, exc_value, exc_traceback)
+    )
 sys.excepthook = log_exception
 logging.info("App started successfully.")
 # ===== Time Tracking Class =====
 class PipelineTimer:
     """Timer for tracking pipeline execution steps"""
     def __init__(self):
         self.reset()
     def reset(self):
         """Reset all timing data for a new request"""
         self.start_time = time.time()
         self.step_times = {}
         self.step_start = None
         self.current_step = None
     @contextmanager
     def time_step(self, step_name: str):
         """Context manager to time a specific step"""
             yield
         finally:
             step_end = time.time()
+            self.step_times[step_name] = round(
+                (step_end - step_start) * 1000, 2
+            )  # Convert to milliseconds
             self.current_step = None
     def get_total_time(self):
         """Get total elapsed time since reset"""
         return round((time.time() - self.start_time) * 1000, 2)
     def get_timing_summary(self) -> Dict:
         """Get a summary of all timing data"""
         total_time = self.get_total_time()
         return {
+            "total_time_ms": total_time,
+            "step_times": self.step_times,
+            "timestamp": datetime.now().isoformat(),
         }

src/vector_store.py CHANGED Viewed

@@ -2,38 +2,34 @@
 Vector Store module for XENO Bot
 Handles ChromaDB vector store operations
 """
 import chromadb
 import numpy as np
 import torch
 from langchain_chroma import Chroma
 from sentence_transformers import util
-from typing import List, Tuple, Any
-from google import genai
-from src.config import (
-    client,
-    COLLECTION_NAME,
-    CHROMA_DB_PATH,
-    RAG_TOP_K,
-    RAG_MAX_RESULTS,
-    EMBEDDING_MODEL
-)
 from src.knowledge_base import get_knowledge_base_data
 def initialize_vector_store() -> Tuple[chromadb.Collection, Chroma, Any]:
     """
     Initialize ChromaDB vector store
     Returns:
         Tuple of (collection, vector_store, retriever)
     """
     # Get knowledge base data
     documents, metadatas, ids = get_knowledge_base_data()
     # Initialize ChromaDB client
     try:
         client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         # Try to get existing collection
         try:
             collection = client.get_collection(name=COLLECTION_NAME)
@@ -43,30 +39,31 @@ def initialize_vector_store() -> Tuple[chromadb.Collection, Chroma, Any]:
             print(f"Creating new ChromaDB collection: {COLLECTION_NAME}")
             collection = client.create_collection(name=COLLECTION_NAME)
             collection.add(documents=documents, metadatas=metadatas, ids=ids)
         # Create vector store and retriever
         vector_store = Chroma(client=client, collection_name=COLLECTION_NAME)
         retriever = vector_store.as_retriever(
-            search_type="similarity",
-            search_kwargs={"k": RAG_TOP_K}
         )
         return collection, vector_store, retriever
     except Exception as e:
         print(f"Failed to initialize ChromaDB: {e}")
         raise
-def generate_embeddings(query: str, documents: List[Any], timer=None) -> Tuple[List[float], List[List[float]]]:
     """
     Generate embeddings for query and documents
     Args:
         query: User query
         documents: List of retrieved documents
         timer: Optional timer object for tracking
     Returns:
         Tuple of (query_embedding, doc_embeddings)
     """
@@ -77,38 +74,40 @@ def generate_embeddings(query: str, documents: List[Any], timer=None) -> Tuple[L
         return _generate_embeddings_impl(query, documents)
-def _generate_embeddings_impl(query: str, documents: List[Any]) -> Tuple[List[float], List[List[float]]]:
     """Internal implementation of embedding generation"""
     # 1. Update query embedding access
-    query_result = client.models.embed_content(
-        model=EMBEDDING_MODEL,
-        contents=query
     )
     # The SDK returns an EmbedContentResponse object with an 'embeddings' attribute
-    query_embedding = query_result.embeddings[0].values
     # 2. Update document embeddings access
     doc_contents = [doc.page_content for doc in documents]
-    doc_results = client.models.embed_content(
-        model=EMBEDDING_MODEL,
-        contents=doc_contents
     )
     # Map the list of embedding objects to a list of vector values
     doc_embeddings = [e.values for e in doc_results.embeddings]
     return query_embedding, doc_embeddings
-def calculate_similarity(query_embedding: List[float], doc_embeddings: List[List[float]], timer=None) -> List[float]:
     """
     Calculate cosine similarity between query and documents
     Args:
         query_embedding: Query embedding vector
         doc_embeddings: List of document embedding vectors
         timer: Optional timer object for tracking
     Returns:
         List of cosine similarity scores
     """
@@ -119,27 +118,32 @@ def calculate_similarity(query_embedding: List[float], doc_embeddings: List[List
         return _calculate_similarity_impl(query_embedding, doc_embeddings)
-def _calculate_similarity_impl(query_embedding: List[float], doc_embeddings: List[List[float]]) -> List[float]:
     """Internal implementation of similarity calculation"""
     cosine_scores = util.cos_sim(
-        torch.tensor(query_embedding).float(),
-        torch.tensor(doc_embeddings).float()
     )[0].tolist()
     return cosine_scores
-def process_context(results: List[Any], cosine_scores: List[float],
-                    max_results: int = RAG_MAX_RESULTS, timer=None) -> Tuple[str, List[str], List[Tuple[str, str]]]:
     """
     Process retrieved context and format for LLM
     Args:
         results: List of retrieved documents
         cosine_scores: List of similarity scores
         max_results: Maximum number of results to include
         timer: Optional timer object for tracking
     Returns:
         Tuple of (formatted_context, source_ids, knowledge_pairs)
     """
@@ -150,28 +154,29 @@ def process_context(results: List[Any], cosine_scores: List[float],
         return _process_context_impl(results, cosine_scores, max_results)
-def _process_context_impl(results: List[Any], cosine_scores: List[float],
-                          max_results: int) -> Tuple[str, List[str], List[Tuple[str, str]]]:
     """Internal implementation of context processing"""
     sorted_indices = np.argsort(cosine_scores)[::-1][:max_results]
     formatted_context = ""
     source_ids = []
     knowledge_pairs = []
     for i, idx in enumerate(sorted_indices, 1):
         result = results[idx]
-        score = cosine_scores[idx]
-        question = result.metadata.get('question', 'N/A')
-        answer = result.metadata.get('content', 'N/A')
         formatted_context += f"Knowledge Entry {i}:\n"
         formatted_context += f"Q: {question}\n"
         formatted_context += f"A: {answer}\n"
         formatted_context += "-" * 40 + "\n"
-        source_ids.append(result.metadata.get('id', 'N/A'))
         knowledge_pairs.append((question, answer))
     return formatted_context, source_ids, knowledge_pairs

 Vector Store module for XENO Bot
 Handles ChromaDB vector store operations
 """
+from typing import Any, List, Tuple
 import chromadb
 import numpy as np
 import torch
 from langchain_chroma import Chroma
 from sentence_transformers import util
+from src.config import (CHROMA_DB_PATH, COLLECTION_NAME, EMBEDDING_MODEL,
+                        RAG_MAX_RESULTS, RAG_TOP_K, genai_client)
 from src.knowledge_base import get_knowledge_base_data
 def initialize_vector_store() -> Tuple[chromadb.Collection, Chroma, Any]:
     """
     Initialize ChromaDB vector store
     Returns:
         Tuple of (collection, vector_store, retriever)
     """
     # Get knowledge base data
     documents, metadatas, ids = get_knowledge_base_data()
     # Initialize ChromaDB client
     try:
         client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         # Try to get existing collection
         try:
             collection = client.get_collection(name=COLLECTION_NAME)
             print(f"Creating new ChromaDB collection: {COLLECTION_NAME}")
             collection = client.create_collection(name=COLLECTION_NAME)
             collection.add(documents=documents, metadatas=metadatas, ids=ids)
         # Create vector store and retriever
         vector_store = Chroma(client=client, collection_name=COLLECTION_NAME)
         retriever = vector_store.as_retriever(
+            search_type="similarity", search_kwargs={"k": RAG_TOP_K}
         )
         return collection, vector_store, retriever
     except Exception as e:
         print(f"Failed to initialize ChromaDB: {e}")
         raise
+def generate_embeddings(
+    query: str, documents: List[Any], timer=None
+) -> Tuple[List[float], List[List[float]]]:
     """
     Generate embeddings for query and documents
     Args:
         query: User query
         documents: List of retrieved documents
         timer: Optional timer object for tracking
     Returns:
         Tuple of (query_embedding, doc_embeddings)
     """
         return _generate_embeddings_impl(query, documents)
+def _generate_embeddings_impl(
+    query: str, documents: List[Any]
+) -> Tuple[List[float], List[List[float]]]:
     """Internal implementation of embedding generation"""
     # 1. Update query embedding access
+    query_result = genai_client.models.embed_content(
+        model=EMBEDDING_MODEL, contents=query
     )
     # The SDK returns an EmbedContentResponse object with an 'embeddings' attribute
+    query_embedding = query_result.embeddings[0].values
     # 2. Update document embeddings access
     doc_contents = [doc.page_content for doc in documents]
+    doc_results = genai_client.models.embed_content(
+        model=EMBEDDING_MODEL, contents=doc_contents
     )
     # Map the list of embedding objects to a list of vector values
     doc_embeddings = [e.values for e in doc_results.embeddings]
     return query_embedding, doc_embeddings
+def calculate_similarity(
+    query_embedding: List[float], doc_embeddings: List[List[float]], timer=None
+) -> List[float]:
     """
     Calculate cosine similarity between query and documents
     Args:
         query_embedding: Query embedding vector
         doc_embeddings: List of document embedding vectors
         timer: Optional timer object for tracking
     Returns:
         List of cosine similarity scores
     """
         return _calculate_similarity_impl(query_embedding, doc_embeddings)
+def _calculate_similarity_impl(
+    query_embedding: List[float], doc_embeddings: List[List[float]]
+) -> List[float]:
     """Internal implementation of similarity calculation"""
     cosine_scores = util.cos_sim(
+        torch.tensor(query_embedding).float(), torch.tensor(doc_embeddings).float()
     )[0].tolist()
     return cosine_scores
+def process_context(
+    results: List[Any],
+    cosine_scores: List[float],
+    max_results: int = RAG_MAX_RESULTS,
+    timer=None,
+) -> Tuple[str, List[str], List[Tuple[str, str]]]:
     """
     Process retrieved context and format for LLM
     Args:
         results: List of retrieved documents
         cosine_scores: List of similarity scores
         max_results: Maximum number of results to include
         timer: Optional timer object for tracking
     Returns:
         Tuple of (formatted_context, source_ids, knowledge_pairs)
     """
         return _process_context_impl(results, cosine_scores, max_results)
+def _process_context_impl(
+    results: List[Any], cosine_scores: List[float], max_results: int
+) -> Tuple[str, List[str], List[Tuple[str, str]]]:
     """Internal implementation of context processing"""
     sorted_indices = np.argsort(cosine_scores)[::-1][:max_results]
     formatted_context = ""
     source_ids = []
     knowledge_pairs = []
     for i, idx in enumerate(sorted_indices, 1):
         result = results[idx]
+        cosine_scores[idx]
+        question = result.metadata.get("question", "N/A")
+        answer = result.metadata.get("content", "N/A")
         formatted_context += f"Knowledge Entry {i}:\n"
         formatted_context += f"Q: {question}\n"
         formatted_context += f"A: {answer}\n"
         formatted_context += "-" * 40 + "\n"
+        source_ids.append(result.metadata.get("id", "N/A"))
         knowledge_pairs.append((question, answer))
     return formatted_context, source_ids, knowledge_pairs

tests/conftest.py CHANGED Viewed

@@ -2,16 +2,18 @@
 Pytest configuration file
 Sets up test environment and fixtures
 """
 import os
 import sys
 import pytest
-from unittest.mock import Mock, MagicMock, patch, PropertyMock
 # Add src to path
-sys.path.insert(0, os.path.join(os.path.dirname(__file__), '..'))
 # Set mock environment variables before importing any modules
-os.environ.setdefault('GEMINI_API_KEY', 'test-api-key-12345')
 # Mock Google Sheets credentials
 mock_credentials = {
@@ -24,20 +26,23 @@ mock_credentials = {
     "auth_uri": "https://accounts.google.com/o/oauth2/auth",
     "token_uri": "https://oauth2.googleapis.com/token",
     "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
-    "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/test"
 }
 import json
-os.environ.setdefault('GOOGLE_SHEETS_CREDENTIALS', json.dumps(mock_credentials))
 # Mock google.oauth2 and gspread modules before src.logger imports them
 mock_credentials_class = MagicMock()
 mock_creds_instance = MagicMock()
-mock_credentials_class.from_service_account_info = Mock(return_value=mock_creds_instance)
 mock_oauth2 = MagicMock()
 mock_oauth2.service_account.Credentials = mock_credentials_class
-sys.modules['google.oauth2'] = mock_oauth2
-sys.modules['google.oauth2.service_account'] = mock_oauth2.service_account
 mock_gspread = MagicMock()
 mock_spreadsheet = MagicMock()
@@ -49,14 +54,15 @@ mock_spreadsheet.add_worksheet = Mock(return_value=mock_worksheet)
 mock_client = MagicMock()
 mock_client.open = Mock(return_value=mock_spreadsheet)
 mock_gspread.authorize = Mock(return_value=mock_client)
-sys.modules['gspread'] = mock_gspread
 @pytest.fixture(autouse=True)
 def mock_google_sheets():
     """Mock Google Sheets to avoid actual connections during testing"""
-    with patch('src.logger.response_sheet') as mock_response, \
-         patch('src.logger.timing_sheet') as mock_timing:
         mock_response.append_row = Mock()
         mock_timing.append_row = Mock()
         yield mock_response, mock_timing
@@ -65,20 +71,16 @@ def mock_google_sheets():
 @pytest.fixture
 def mock_genai():
     """Mock Google Generative AI"""
-    with patch('google.generativeai.configure') as mock_config, \
-         patch('google.generativeai.GenerativeModel') as mock_model, \
-         patch('google.generativeai.embed_content') as mock_embed:
-        yield {
-            'configure': mock_config,
-            'model': mock_model,
-            'embed': mock_embed
-        }
 @pytest.fixture
 def mock_chromadb():
     """Mock ChromaDB client"""
-    with patch('chromadb.PersistentClient') as mock_client:
         mock_collection = Mock()
         mock_client.return_value.get_collection.return_value = mock_collection
         yield mock_client
@@ -87,7 +89,7 @@ def mock_chromadb():
 @pytest.fixture
 def mock_sqlite():
     """Mock SQLite connections for memory"""
-    with patch('sqlite3.connect') as mock_connect:
         mock_conn = Mock()
         mock_connect.return_value = mock_conn
         yield mock_conn
@@ -97,21 +99,42 @@ def mock_sqlite():
 def sample_documents():
     """Provide sample documents for testing"""
     doc1 = Mock()
-    doc1.page_content = "Question: How do I create an account?\nAnswer: Visit our website."
     doc1.metadata = {
-        'id': 'KB001',
-        'question': 'How do I create an account?',
-        'content': 'Visit our website.',
-        'section': 'Account Management'
     }
     doc2 = Mock()
     doc2.page_content = "Question: What are the fees?\nAnswer: 1% per transaction."
     doc2.metadata = {
-        'id': 'KB002',
-        'question': 'What are the fees?',
-        'content': '1% per transaction.',
-        'section': 'Fees'
     }
     return [doc1, doc2]

 Pytest configuration file
 Sets up test environment and fixtures
 """
 import os
 import sys
+from unittest.mock import MagicMock, Mock, patch
 import pytest
 # Add src to path
+sys.path.insert(0, os.path.join(os.path.dirname(__file__), ".."))
 # Set mock environment variables before importing any modules
+os.environ.setdefault("GEMINI_API_KEY", "test-api-key-12345")
 # Mock Google Sheets credentials
 mock_credentials = {
     "auth_uri": "https://accounts.google.com/o/oauth2/auth",
     "token_uri": "https://oauth2.googleapis.com/token",
     "auth_provider_x509_cert_url": "https://www.googleapis.com/oauth2/v1/certs",
+    "client_x509_cert_url": "https://www.googleapis.com/robot/v1/metadata/x509/test",
 }
 import json
+os.environ.setdefault("GOOGLE_SHEETS_CREDENTIALS", json.dumps(mock_credentials))
 # Mock google.oauth2 and gspread modules before src.logger imports them
 mock_credentials_class = MagicMock()
 mock_creds_instance = MagicMock()
+mock_credentials_class.from_service_account_info = Mock(
+    return_value=mock_creds_instance
+)
 mock_oauth2 = MagicMock()
 mock_oauth2.service_account.Credentials = mock_credentials_class
+sys.modules["google.oauth2"] = mock_oauth2
+sys.modules["google.oauth2.service_account"] = mock_oauth2.service_account
 mock_gspread = MagicMock()
 mock_spreadsheet = MagicMock()
 mock_client = MagicMock()
 mock_client.open = Mock(return_value=mock_spreadsheet)
 mock_gspread.authorize = Mock(return_value=mock_client)
+sys.modules["gspread"] = mock_gspread
 @pytest.fixture(autouse=True)
 def mock_google_sheets():
     """Mock Google Sheets to avoid actual connections during testing"""
+    with patch("src.logger.response_sheet") as mock_response, patch(
+        "src.logger.timing_sheet"
+    ) as mock_timing:
         mock_response.append_row = Mock()
         mock_timing.append_row = Mock()
         yield mock_response, mock_timing
 @pytest.fixture
 def mock_genai():
     """Mock Google Generative AI"""
+    with patch("google.generativeai.configure") as mock_config, patch(
+        "google.generativeai.GenerativeModel"
+    ) as mock_model, patch("google.generativeai.embed_content") as mock_embed:
+        yield {"configure": mock_config, "model": mock_model, "embed": mock_embed}
 @pytest.fixture
 def mock_chromadb():
     """Mock ChromaDB client"""
+    with patch("chromadb.PersistentClient") as mock_client:
         mock_collection = Mock()
         mock_client.return_value.get_collection.return_value = mock_collection
         yield mock_client
 @pytest.fixture
 def mock_sqlite():
     """Mock SQLite connections for memory"""
+    with patch("sqlite3.connect") as mock_connect:
         mock_conn = Mock()
         mock_connect.return_value = mock_conn
         yield mock_conn
 def sample_documents():
     """Provide sample documents for testing"""
     doc1 = Mock()
+    doc1.page_content = (
+        "Question: How do I create an account?\nAnswer: Visit our website."
+    )
     doc1.metadata = {
+        "id": "KB001",
+        "question": "How do I create an account?",
+        "content": "Visit our website.",
+        "section": "Account Management",
     }
     doc2 = Mock()
     doc2.page_content = "Question: What are the fees?\nAnswer: 1% per transaction."
     doc2.metadata = {
+        "id": "KB002",
+        "question": "What are the fees?",
+        "content": "1% per transaction.",
+        "section": "Fees",
     }
     return [doc1, doc2]
+@pytest.fixture
+def mock_genai_client():
+    """Mock Google Generative AI client with new SDK structure"""
+    with patch("src.config.genai_client") as mock_client:
+        # Mock generate_content for LLM
+        mock_generate_response = Mock()
+        mock_generate_response.text = "Test response from LLM"
+        mock_client.models.generate_content.return_value = mock_generate_response
+        # Mock embed_content for embeddings
+        mock_embedding = Mock()
+        mock_embedding.values = [0.1, 0.2, 0.3]
+        mock_embed_response = Mock()
+        mock_embed_response.embeddings = [mock_embedding]
+        mock_client.models.embed_content.return_value = mock_embed_response
+        yield mock_client

tests/test_app.py ADDED Viewed

	@@ -0,0 +1,411 @@

+"""
+Unit tests for app module
+Tests main orchestration logic
+"""
+import unittest
+from unittest.mock import MagicMock, Mock, patch
+from app import get_context_and_answer
+class TestApp(unittest.TestCase):
+    """Test cases for app module"""
+    def setUp(self):
+        """Set up test fixtures"""
+        self.message = "How do I create an account?"
+        self.history = [["Previous question", "Previous answer"]]
+        self.session_id = "test-session-123"
+        self.mock_intent_classifier = Mock()
+        self.mock_retriever = Mock()
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_simple_intent(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+    ):
+        """Test get_context_and_answer with simple intent (greeting)"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = (
+            "greeting",
+            "Hello! How can I help you?",
+        )
+        # Call function
+        answer = get_context_and_answer(
+            "Hello",
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Verify intent was classified
+        self.mock_intent_classifier.classify_intent.assert_called_once_with("Hello")
+        # Should not use retriever for simple intent
+        self.mock_retriever.invoke.assert_not_called()
+        # Verify response
+        self.assertEqual(answer, "Hello! How can I help you?")
+        # Verify memory was updated
+        mock_update_memory.assert_called_once()
+        # Verify logging
+        mock_log_response.assert_called_once()
+        mock_log_timing.assert_called_once()
+    @patch("app.generate_xeno_response")
+    @patch("app.process_context")
+    @patch("app.generate_embeddings")
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_query_intent(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+        mock_generate_embeddings,
+        mock_process_context,
+        mock_generate_response,
+    ):
+        """Test get_context_and_answer with query intent"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Mock retriever
+        mock_doc = Mock()
+        mock_doc.page_content = "Test content"
+        mock_doc.metadata = {"id": "KB001", "question": "Q", "content": "A"}
+        self.mock_retriever.invoke.return_value = [mock_doc]
+        # Mock embeddings
+        mock_generate_embeddings.return_value = (
+            [0.1, 0.2, 0.3],  # query embedding
+            [[0.2, 0.3, 0.4]],  # doc embeddings
+        )
+        # Mock context processing
+        mock_process_context.return_value = (
+            "Formatted context",
+            ["KB001"],
+            [("Q", "A")],
+        )
+        # Mock LLM response
+        mock_generate_response.return_value = "Generated answer"
+        # Call function
+        answer = get_context_and_answer(
+            self.message,
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Verify RAG pipeline was executed
+        self.mock_retriever.invoke.assert_called_once_with(self.message)
+        mock_generate_embeddings.assert_called_once()
+        mock_process_context.assert_called_once()
+        mock_generate_response.assert_called_once()
+        # Verify response
+        self.assertEqual(answer, "Generated answer")
+        # Verify logging
+        mock_log_response.assert_called_once()
+        mock_log_timing.assert_called_once()
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_short_message(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+    ):
+        """Test get_context_and_answer with very short message"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Call function with short message
+        answer = get_context_and_answer(
+            "Hi",
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should return a request for more details
+        self.assertIn("more details", answer)
+        # Should not invoke retriever
+        self.mock_retriever.invoke.assert_not_called()
+    @patch("app.generate_embeddings")
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_low_similarity(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+        mock_generate_embeddings,
+    ):
+        """Test get_context_and_answer with low similarity score"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Mock retriever
+        mock_doc = Mock()
+        mock_doc.page_content = "Test content"
+        self.mock_retriever.invoke.return_value = [mock_doc]
+        # Mock embeddings with low similarity
+        mock_generate_embeddings.return_value = (
+            [0.1, 0.2, 0.3],
+            [[1.0, 0.0, 0.0]],  # Will result in low cosine score
+        )
+        # Call function
+        answer = get_context_and_answer(
+            "Some random question",
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should return "couldn't find" message
+        self.assertIn("couldn't find", answer)
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_rag_error(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+    ):
+        """Test get_context_and_answer handles RAG errors gracefully"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Mock retriever to raise exception
+        self.mock_retriever.invoke.side_effect = Exception("Database error")
+        # Call function
+        answer = get_context_and_answer(
+            self.message,
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should return technical issue message
+        self.assertIn("technical issue", answer)
+        # Verify error was logged
+        mock_log_timing.assert_called_once()
+        call_kwargs = mock_log_timing.call_args[1]
+        self.assertIsNotNone(call_kwargs.get("error_step"))
+    @patch("app.log_timing_data")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_main_error(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_timing,
+    ):
+        """Test get_context_and_answer handles main pipeline errors"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.side_effect = Exception("Memory error")
+        # Call function
+        answer = get_context_and_answer(
+            self.message,
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should return error message
+        self.assertIn("error", answer)
+        # Verify error was logged
+        mock_log_timing.assert_called_once()
+    @patch("app.generate_xeno_response")
+    @patch("app.process_context")
+    @patch("app.generate_embeddings")
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_with_chat_history(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+        mock_generate_embeddings,
+        mock_process_context,
+        mock_generate_response,
+    ):
+        """Test get_context_and_answer passes chat history to LLM"""
+        # Setup mocks
+        mock_session_config.return_value = {"session_id": self.session_id}
+        chat_history = [
+            {"role": "user", "content": "Previous question"},
+            {"role": "assistant", "content": "Previous answer"},
+        ]
+        mock_retrieve_memory.return_value = chat_history
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Mock retriever
+        mock_doc = Mock()
+        mock_doc.page_content = "Test content"
+        mock_doc.metadata = {"id": "KB001", "question": "Q", "content": "A"}
+        self.mock_retriever.invoke.return_value = [mock_doc]
+        # Mock embeddings
+        mock_generate_embeddings.return_value = ([0.1, 0.2], [[0.9, 0.1]])
+        # Mock context processing
+        mock_process_context.return_value = ("Context", ["KB001"], [("Q", "A")])
+        # Mock LLM response
+        mock_generate_response.return_value = "Answer with context"
+        # Call function
+        answer = get_context_and_answer(
+            self.message,
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Verify chat history was passed to LLM
+        mock_generate_response.assert_called_once()
+        call_args = mock_generate_response.call_args[0]
+        self.assertEqual(call_args[2], chat_history)
+    @patch("app.PipelineTimer")
+    @patch("app.generate_xeno_response")
+    @patch("app.process_context")
+    @patch("app.generate_embeddings")
+    @patch("app.log_timing_data")
+    @patch("app.log_response")
+    @patch("app.update_memory")
+    @patch("app.retrieve_memory")
+    @patch("app.create_session_config")
+    def test_get_context_and_answer_timing(
+        self,
+        mock_session_config,
+        mock_retrieve_memory,
+        mock_update_memory,
+        mock_log_response,
+        mock_log_timing,
+        mock_generate_embeddings,
+        mock_process_context,
+        mock_generate_response,
+        mock_timer_class,
+    ):
+        """Test get_context_and_answer uses PipelineTimer correctly"""
+        # Setup mocks
+        mock_timer = Mock()
+        mock_timer.time_step = MagicMock()
+        mock_timer.time_step.return_value.__enter__ = Mock()
+        mock_timer.time_step.return_value.__exit__ = Mock()
+        mock_timer.get_timing_summary.return_value = {"total": 1.5}
+        mock_timer_class.return_value = mock_timer
+        mock_session_config.return_value = {"session_id": self.session_id}
+        mock_retrieve_memory.return_value = []
+        self.mock_intent_classifier.classify_intent.return_value = ("query", None)
+        # Mock retriever
+        mock_doc = Mock()
+        mock_doc.page_content = "Test"
+        mock_doc.metadata = {"id": "KB001", "question": "Q", "content": "A"}
+        self.mock_retriever.invoke.return_value = [mock_doc]
+        # Mock embeddings
+        mock_generate_embeddings.return_value = ([0.1], [[0.9]])
+        mock_process_context.return_value = ("Context", ["KB001"], [("Q", "A")])
+        mock_generate_response.return_value = "Answer"
+        # Call function
+        get_context_and_answer(
+            self.message,
+            self.history,
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Verify timer was used
+        mock_timer.reset.assert_called_once()
+        mock_timer.get_timing_summary.assert_called()
+        # Verify timing was logged
+        mock_log_timing.assert_called_once()
+        call_args = mock_log_timing.call_args[0]
+        # Second positional argument is session_id, third is timing_summary
+        self.assertIn("total", call_args[2])
+if __name__ == "__main__":
+    unittest.main()

tests/test_intent_classifier.py CHANGED Viewed

@@ -2,25 +2,27 @@
 Unit tests for intent_classifier module
 Tests the IntentClassifier class
 """
 import unittest
 from unittest.mock import Mock
 from src.intent_classifier import IntentClassifier
 class TestIntentClassifier(unittest.TestCase):
     """Test cases for IntentClassifier class"""
     def setUp(self):
         """Set up test fixtures"""
         self.classifier = IntentClassifier()
     def test_initialization(self):
         """Test classifier initialization"""
         self.assertIsNotNone(self.classifier.intent_patterns)
-        self.assertIn('greeting', self.classifier.intent_patterns)
-        self.assertIn('thanks', self.classifier.intent_patterns)
-        self.assertIn('goodbye', self.classifier.intent_patterns)
     def test_classify_greeting(self):
         """Test classification of greeting messages"""
         test_cases = [
@@ -29,15 +31,15 @@ class TestIntentClassifier(unittest.TestCase):
             "Hey there",
             "good morning",
             "Good afternoon!",
-            "how are you"
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
-            self.assertEqual(intent, 'greeting', f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_thanks(self):
         """Test classification of thank you messages"""
         test_cases = [
@@ -47,15 +49,15 @@ class TestIntentClassifier(unittest.TestCase):
             "thx",
             "I appreciate it",
             "thanks a lot",
-            "thank you so much"
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
-            self.assertEqual(intent, 'thanks', f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_goodbye(self):
         """Test classification of goodbye messages"""
         test_cases = [
@@ -65,78 +67,82 @@ class TestIntentClassifier(unittest.TestCase):
             "farewell",
             "take care",
             "have a good day",
-            "talk to you later"
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
-            self.assertEqual(intent, 'goodbye', f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_query(self):
         """Test classification of query messages"""
         test_cases = [
             "How do I open an account?",
             "What are the transaction fees?",
             "Can you help me with my balance?",
-            "Tell me about XENO services"
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
-            self.assertEqual(intent, 'query', f"Failed for message: {message}")
-            self.assertEqual(response, '')
     def test_case_insensitivity(self):
         """Test that classification is case insensitive"""
         messages = [
-            ("HI", 'greeting'),
-            ("THANK YOU", 'thanks'),
-            ("BYE", 'goodbye'),
-            ("Hi There", 'greeting')
         ]
         for message, expected_intent in messages:
             intent, _ = self.classifier.classify_intent(message)
             self.assertEqual(intent, expected_intent)
     def test_with_timer(self):
         """Test classification with timer object"""
         mock_timer = Mock()
         mock_timer.time_step = Mock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         intent, response = self.classifier.classify_intent("hello", timer=mock_timer)
-        self.assertEqual(intent, 'greeting')
         mock_timer.time_step.assert_called_once_with("intent_classification")
     def test_is_simple_intent(self):
         """Test is_simple_intent method"""
-        self.assertTrue(self.classifier.is_simple_intent('greeting'))
-        self.assertTrue(self.classifier.is_simple_intent('thanks'))
-        self.assertFalse(self.classifier.is_simple_intent('goodbye'))
-        self.assertFalse(self.classifier.is_simple_intent('query'))
     def test_add_intent(self):
         """Test adding a new intent"""
-        patterns = [r'\b(test|testing)\b']
         responses = ["This is a test response"]
-        self.classifier.add_intent('test_intent', patterns, responses)
         # Verify intent was added
-        self.assertIn('test_intent', self.classifier.intent_patterns)
-        self.assertEqual(self.classifier.intent_patterns['test_intent']['patterns'], patterns)
-        self.assertEqual(self.classifier.intent_patterns['test_intent']['responses'], responses)
         # Test classification with new intent
         intent, response = self.classifier.classify_intent("testing")
-        self.assertEqual(intent, 'test_intent')
         self.assertEqual(response, "This is a test response")
     def test_response_variety(self):
         """Test that responses vary (random selection)"""
         # Multiple calls might return different responses
@@ -144,26 +150,26 @@ class TestIntentClassifier(unittest.TestCase):
         for _ in range(20):
             _, response = self.classifier.classify_intent("hello")
             responses.add(response)
         # Should have at least 1 response (could be more if random varies)
         self.assertGreater(len(responses), 0)
     def test_empty_message(self):
         """Test classification of empty or whitespace messages"""
         test_cases = ["", "   ", "\n", "\t"]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
-            self.assertEqual(intent, 'query')
-            self.assertEqual(response, '')
     def test_mixed_intent_message(self):
         """Test messages that might match multiple patterns"""
         # "hi thank you" should match greeting (first match wins)
         intent, response = self.classifier.classify_intent("hi thank you")
         # Should match the first pattern it encounters
-        self.assertIn(intent, ['greeting', 'thanks'])
-if __name__ == '__main__':
     unittest.main()

 Unit tests for intent_classifier module
 Tests the IntentClassifier class
 """
 import unittest
 from unittest.mock import Mock
 from src.intent_classifier import IntentClassifier
 class TestIntentClassifier(unittest.TestCase):
     """Test cases for IntentClassifier class"""
     def setUp(self):
         """Set up test fixtures"""
         self.classifier = IntentClassifier()
     def test_initialization(self):
         """Test classifier initialization"""
         self.assertIsNotNone(self.classifier.intent_patterns)
+        self.assertIn("greeting", self.classifier.intent_patterns)
+        self.assertIn("thanks", self.classifier.intent_patterns)
+        self.assertIn("goodbye", self.classifier.intent_patterns)
     def test_classify_greeting(self):
         """Test classification of greeting messages"""
         test_cases = [
             "Hey there",
             "good morning",
             "Good afternoon!",
+            "how are you",
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
+            self.assertEqual(intent, "greeting", f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_thanks(self):
         """Test classification of thank you messages"""
         test_cases = [
             "thx",
             "I appreciate it",
             "thanks a lot",
+            "thank you so much",
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
+            self.assertEqual(intent, "thanks", f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_goodbye(self):
         """Test classification of goodbye messages"""
         test_cases = [
             "farewell",
             "take care",
             "have a good day",
+            "talk to you later",
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
+            self.assertEqual(intent, "goodbye", f"Failed for message: {message}")
             self.assertIsInstance(response, str)
             self.assertGreater(len(response), 0)
     def test_classify_query(self):
         """Test classification of query messages"""
         test_cases = [
             "How do I open an account?",
             "What are the transaction fees?",
             "Can you help me with my balance?",
+            "Tell me about XENO services",
         ]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
+            self.assertEqual(intent, "query", f"Failed for message: {message}")
+            self.assertEqual(response, "")
     def test_case_insensitivity(self):
         """Test that classification is case insensitive"""
         messages = [
+            ("HI", "greeting"),
+            ("THANK YOU", "thanks"),
+            ("BYE", "goodbye"),
+            ("Hi There", "greeting"),
         ]
         for message, expected_intent in messages:
             intent, _ = self.classifier.classify_intent(message)
             self.assertEqual(intent, expected_intent)
     def test_with_timer(self):
         """Test classification with timer object"""
         mock_timer = Mock()
         mock_timer.time_step = Mock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         intent, response = self.classifier.classify_intent("hello", timer=mock_timer)
+        self.assertEqual(intent, "greeting")
         mock_timer.time_step.assert_called_once_with("intent_classification")
     def test_is_simple_intent(self):
         """Test is_simple_intent method"""
+        self.assertTrue(self.classifier.is_simple_intent("greeting"))
+        self.assertTrue(self.classifier.is_simple_intent("thanks"))
+        self.assertFalse(self.classifier.is_simple_intent("goodbye"))
+        self.assertFalse(self.classifier.is_simple_intent("query"))
     def test_add_intent(self):
         """Test adding a new intent"""
+        patterns = [r"\b(test|testing)\b"]
         responses = ["This is a test response"]
+        self.classifier.add_intent("test_intent", patterns, responses)
         # Verify intent was added
+        self.assertIn("test_intent", self.classifier.intent_patterns)
+        self.assertEqual(
+            self.classifier.intent_patterns["test_intent"]["patterns"], patterns
+        )
+        self.assertEqual(
+            self.classifier.intent_patterns["test_intent"]["responses"], responses
+        )
         # Test classification with new intent
         intent, response = self.classifier.classify_intent("testing")
+        self.assertEqual(intent, "test_intent")
         self.assertEqual(response, "This is a test response")
     def test_response_variety(self):
         """Test that responses vary (random selection)"""
         # Multiple calls might return different responses
         for _ in range(20):
             _, response = self.classifier.classify_intent("hello")
             responses.add(response)
         # Should have at least 1 response (could be more if random varies)
         self.assertGreater(len(responses), 0)
     def test_empty_message(self):
         """Test classification of empty or whitespace messages"""
         test_cases = ["", "   ", "\n", "\t"]
         for message in test_cases:
             intent, response = self.classifier.classify_intent(message)
+            self.assertEqual(intent, "query")
+            self.assertEqual(response, "")
     def test_mixed_intent_message(self):
         """Test messages that might match multiple patterns"""
         # "hi thank you" should match greeting (first match wins)
         intent, response = self.classifier.classify_intent("hi thank you")
         # Should match the first pattern it encounters
+        self.assertIn(intent, ["greeting", "thanks"])
+if __name__ == "__main__":
     unittest.main()

tests/test_interface.py ADDED Viewed

	@@ -0,0 +1,135 @@

+"""
+Unit tests for interface module
+Tests Gradio interface functionality
+"""
+import unittest
+import uuid
+from unittest.mock import MagicMock, Mock, patch
+from src.interface import create_interface, respond
+class TestInterface(unittest.TestCase):
+    """Test cases for interface module"""
+    def setUp(self):
+        """Set up test fixtures"""
+        self.message = "How do I create an account?"
+        self.history = [["Previous question", "Previous answer"]]
+        self.session_id = str(uuid.uuid4())
+        self.mock_intent_classifier = Mock()
+        self.mock_retriever = Mock()
+    @patch("app.get_context_and_answer")
+    def test_respond_with_session_id(self, mock_get_answer):
+        """Test respond function with existing session ID"""
+        mock_get_answer.return_value = "You can create an account by visiting our website."
+        result_msg, result_history = respond(
+            self.message,
+            self.history.copy(),
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Verify get_context_and_answer was called
+        mock_get_answer.assert_called_once()
+        call_args = mock_get_answer.call_args[0]
+        self.assertEqual(call_args[0], self.message)
+        self.assertEqual(call_args[2], self.session_id)
+        # Check return values
+        self.assertEqual(result_msg, "")
+        self.assertEqual(len(result_history), 2)
+        self.assertEqual(result_history[-1][0], self.message)
+        self.assertEqual(
+            result_history[-1][1],
+            "You can create an account by visiting our website.",
+        )
+    @patch("app.get_context_and_answer")
+    def test_respond_without_session_id(self, mock_get_answer):
+        """Test respond function generates session ID when none provided"""
+        mock_get_answer.return_value = "Response"
+        result_msg, result_history = respond(
+            self.message,
+            [],
+            None,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should have called with a generated session ID
+        self.assertEqual(mock_get_answer.call_count, 1)
+        call_args = mock_get_answer.call_args[0]
+        generated_session_id = call_args[2]
+        # Verify it's a valid UUID
+        try:
+            uuid.UUID(generated_session_id)
+            valid_uuid = True
+        except ValueError:
+            valid_uuid = False
+        self.assertTrue(valid_uuid)
+        # Check return values
+        self.assertEqual(result_msg, "")
+        self.assertEqual(len(result_history), 1)
+    @patch("app.get_context_and_answer")
+    def test_respond_with_empty_history(self, mock_get_answer):
+        """Test respond function with empty history"""
+        mock_get_answer.return_value = "Test response"
+        result_msg, result_history = respond(
+            "Test question",
+            [],
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # History should have one entry
+        self.assertEqual(len(result_history), 1)
+        self.assertEqual(result_history[0][0], "Test question")
+        self.assertEqual(result_history[0][1], "Test response")
+    @patch("app.get_context_and_answer")
+    def test_respond_preserves_existing_history(self, mock_get_answer):
+        """Test respond function preserves existing chat history"""
+        mock_get_answer.return_value = "New response"
+        initial_history = [
+            ["Question 1", "Answer 1"],
+            ["Question 2", "Answer 2"],
+        ]
+        result_msg, result_history = respond(
+            "Question 3",
+            initial_history.copy(),
+            self.session_id,
+            self.mock_intent_classifier,
+            self.mock_retriever,
+        )
+        # Should have 3 entries now
+        self.assertEqual(len(result_history), 3)
+        self.assertEqual(result_history[0][0], "Question 1")
+        self.assertEqual(result_history[1][0], "Question 2")
+        self.assertEqual(result_history[2][0], "Question 3")
+    def test_create_interface_returns_blocks(self):
+        """Test create_interface returns Gradio Blocks interface"""
+        result = create_interface(self.mock_intent_classifier, self.mock_retriever)
+        # Should return a Gradio Blocks object
+        import gradio as gr
+        self.assertIsInstance(result, gr.Blocks)
+if __name__ == "__main__":
+    unittest.main()

tests/test_knowledge_base.py CHANGED Viewed

@@ -2,22 +2,22 @@
 Unit tests for knowledge_base module
 Tests knowledge base loading and preparation
 """
-import unittest
-import pandas as pd
 import json
-import tempfile
 import os
-from unittest.mock import patch, Mock
-from src.knowledge_base import (
-    load_knowledge_base,
-    prepare_documents,
-    get_knowledge_base_data
-)
 class TestKnowledgeBase(unittest.TestCase):
     """Test cases for knowledge_base module"""
     def setUp(self):
         """Set up test fixtures"""
         # Create sample knowledge base data
@@ -29,7 +29,7 @@ class TestKnowledgeBase(unittest.TestCase):
                 "Section": "Account Management",
                 "Source": "Website",
                 "Owner": "Support Team",
-                "Tag": "account"
             },
             {
                 "ID": "KB002",
@@ -38,35 +38,33 @@ class TestKnowledgeBase(unittest.TestCase):
                 "Section": "Fees",
                 "Source": "Documentation",
                 "Owner": "Finance Team",
-                "Tag": "fees"
-            }
         ]
         # Create temporary JSON file
         self.temp_file = tempfile.NamedTemporaryFile(
-            mode='w',
-            delete=False,
-            suffix='.json'
         )
         json.dump(self.sample_data, self.temp_file)
         self.temp_file.close()
     def tearDown(self):
         """Clean up test fixtures"""
         if os.path.exists(self.temp_file.name):
             os.unlink(self.temp_file.name)
     def test_load_knowledge_base(self):
         """Test loading knowledge base from JSON file"""
         df = load_knowledge_base(self.temp_file.name)
         # Check DataFrame structure
         self.assertIsInstance(df, pd.DataFrame)
         self.assertEqual(len(df), 2)
-        self.assertIn('ID', df.columns)
-        self.assertIn('Question', df.columns)
-        self.assertIn('Content', df.columns)
     def test_load_knowledge_base_drops_null_content(self):
         """Test that rows with null Content are dropped"""
         data_with_null = self.sample_data + [
@@ -74,110 +72,124 @@ class TestKnowledgeBase(unittest.TestCase):
                 "ID": "KB003",
                 "Question": "Test question?",
                 "Content": None,
-                "Section": "Test"
             }
         ]
         temp_file_null = tempfile.NamedTemporaryFile(
-            mode='w',
-            delete=False,
-            suffix='.json'
         )
         json.dump(data_with_null, temp_file_null)
         temp_file_null.close()
         try:
             df = load_knowledge_base(temp_file_null.name)
             # Should only have 2 rows (null Content row dropped)
             self.assertEqual(len(df), 2)
         finally:
             os.unlink(temp_file_null.name)
     def test_prepare_documents(self):
         """Test preparing documents for vector store"""
         documents, metadatas, ids = prepare_documents(self.sample_data)
         # Check lengths match
         self.assertEqual(len(documents), 2)
         self.assertEqual(len(metadatas), 2)
         self.assertEqual(len(ids), 2)
         # Check document format
         self.assertIn("Question:", documents[0])
         self.assertIn("Answer:", documents[0])
         self.assertIn("How do I create an account?", documents[0])
         # Check metadata structure
-        self.assertEqual(metadatas[0]['id'], 'KB001')
-        self.assertEqual(metadatas[0]['question'], 'How do I create an account?')
-        self.assertEqual(metadatas[0]['section'], 'Account Management')
         # Check IDs
-        self.assertEqual(ids[0], 'KB001')
-        self.assertEqual(ids[1], 'KB002')
     def test_prepare_documents_with_missing_fields(self):
         """Test preparing documents with missing optional fields"""
         data_minimal = [
-            {
-                "ID": "KB001",
-                "Question": "Test question?",
-                "Content": "Test answer."
-            }
         ]
         documents, metadatas, ids = prepare_documents(data_minimal)
         # Should still work with defaults
         self.assertEqual(len(documents), 1)
-        self.assertEqual(metadatas[0]['section'], '')
-        self.assertEqual(metadatas[0]['source'], '')
-        self.assertEqual(metadatas[0]['owner'], '')
-        self.assertEqual(metadatas[0]['tag'], '')
-    @patch('src.knowledge_base.load_knowledge_base')
     def test_get_knowledge_base_data(self, mock_load):
         """Test get_knowledge_base_data function"""
         # Mock the load_knowledge_base function
         mock_df = pd.DataFrame(self.sample_data)
         mock_load.return_value = mock_df
         documents, metadatas, ids = get_knowledge_base_data()
         # Verify load was called
         mock_load.assert_called_once()
         # Verify output
         self.assertEqual(len(documents), 2)
         self.assertEqual(len(metadatas), 2)
         self.assertEqual(len(ids), 2)
     def test_document_text_format(self):
         """Test that document text is properly formatted"""
         documents, _, _ = prepare_documents(self.sample_data)
         # Check first document format
         expected_format = "Question: How do I create an account?\nAnswer: You can create an account by visiting our website."
         self.assertEqual(documents[0], expected_format)
     def test_empty_knowledge_base(self):
         """Test handling of empty knowledge base"""
         empty_data = []
         documents, metadatas, ids = prepare_documents(empty_data)
         self.assertEqual(len(documents), 0)
         self.assertEqual(len(metadatas), 0)
         self.assertEqual(len(ids), 0)
     def test_metadata_completeness(self):
         """Test that all metadata fields are present"""
         _, metadatas, _ = prepare_documents(self.sample_data)
-        required_fields = ['question', 'content', 'section', 'source', 'owner', 'tag', 'id']
         for metadata in metadatas:
             for field in required_fields:
                 self.assertIn(field, metadata)
-if __name__ == '__main__':
     unittest.main()

 Unit tests for knowledge_base module
 Tests knowledge base loading and preparation
 """
 import json
 import os
+import tempfile
+import unittest
+from unittest.mock import patch
+import pandas as pd
+from src.knowledge_base import (get_knowledge_base_data, load_knowledge_base,
+                                prepare_documents)
 class TestKnowledgeBase(unittest.TestCase):
     """Test cases for knowledge_base module"""
     def setUp(self):
         """Set up test fixtures"""
         # Create sample knowledge base data
                 "Section": "Account Management",
                 "Source": "Website",
                 "Owner": "Support Team",
+                "Tag": "account",
             },
             {
                 "ID": "KB002",
                 "Section": "Fees",
                 "Source": "Documentation",
                 "Owner": "Finance Team",
+                "Tag": "fees",
+            },
         ]
         # Create temporary JSON file
         self.temp_file = tempfile.NamedTemporaryFile(
+            mode="w", delete=False, suffix=".json"
         )
         json.dump(self.sample_data, self.temp_file)
         self.temp_file.close()
     def tearDown(self):
         """Clean up test fixtures"""
         if os.path.exists(self.temp_file.name):
             os.unlink(self.temp_file.name)
     def test_load_knowledge_base(self):
         """Test loading knowledge base from JSON file"""
         df = load_knowledge_base(self.temp_file.name)
         # Check DataFrame structure
         self.assertIsInstance(df, pd.DataFrame)
         self.assertEqual(len(df), 2)
+        self.assertIn("ID", df.columns)
+        self.assertIn("Question", df.columns)
+        self.assertIn("Content", df.columns)
     def test_load_knowledge_base_drops_null_content(self):
         """Test that rows with null Content are dropped"""
         data_with_null = self.sample_data + [
                 "ID": "KB003",
                 "Question": "Test question?",
                 "Content": None,
+                "Section": "Test",
             }
         ]
         temp_file_null = tempfile.NamedTemporaryFile(
+            mode="w", delete=False, suffix=".json"
         )
         json.dump(data_with_null, temp_file_null)
         temp_file_null.close()
         try:
             df = load_knowledge_base(temp_file_null.name)
             # Should only have 2 rows (null Content row dropped)
             self.assertEqual(len(df), 2)
         finally:
             os.unlink(temp_file_null.name)
     def test_prepare_documents(self):
         """Test preparing documents for vector store"""
         documents, metadatas, ids = prepare_documents(self.sample_data)
         # Check lengths match
         self.assertEqual(len(documents), 2)
         self.assertEqual(len(metadatas), 2)
         self.assertEqual(len(ids), 2)
         # Check document format
         self.assertIn("Question:", documents[0])
         self.assertIn("Answer:", documents[0])
         self.assertIn("How do I create an account?", documents[0])
         # Check metadata structure
+        self.assertEqual(metadatas[0]["id"], "KB001")
+        self.assertEqual(metadatas[0]["question"], "How do I create an account?")
+        self.assertEqual(metadatas[0]["section"], "Account Management")
         # Check IDs
+        self.assertEqual(ids[0], "KB001")
+        self.assertEqual(ids[1], "KB002")
     def test_prepare_documents_with_missing_fields(self):
         """Test preparing documents with missing optional fields"""
         data_minimal = [
+            {"ID": "KB001", "Question": "Test question?", "Content": "Test answer."}
         ]
         documents, metadatas, ids = prepare_documents(data_minimal)
         # Should still work with defaults
         self.assertEqual(len(documents), 1)
+        self.assertEqual(metadatas[0]["section"], "")
+        self.assertEqual(metadatas[0]["source"], "")
+        self.assertEqual(metadatas[0]["owner"], "")
+        self.assertEqual(metadatas[0]["tag"], "")
+    @patch("src.knowledge_base.load_knowledge_base")
     def test_get_knowledge_base_data(self, mock_load):
         """Test get_knowledge_base_data function"""
         # Mock the load_knowledge_base function
         mock_df = pd.DataFrame(self.sample_data)
         mock_load.return_value = mock_df
         documents, metadatas, ids = get_knowledge_base_data()
         # Verify load was called
         mock_load.assert_called_once()
         # Verify output
         self.assertEqual(len(documents), 2)
         self.assertEqual(len(metadatas), 2)
         self.assertEqual(len(ids), 2)
     def test_document_text_format(self):
         """Test that document text is properly formatted"""
         documents, _, _ = prepare_documents(self.sample_data)
         # Check first document format
         expected_format = "Question: How do I create an account?\nAnswer: You can create an account by visiting our website."
         self.assertEqual(documents[0], expected_format)
     def test_empty_knowledge_base(self):
         """Test handling of empty knowledge base"""
         empty_data = []
         documents, metadatas, ids = prepare_documents(empty_data)
         self.assertEqual(len(documents), 0)
         self.assertEqual(len(metadatas), 0)
         self.assertEqual(len(ids), 0)
     def test_metadata_completeness(self):
         """Test that all metadata fields are present"""
         _, metadatas, _ = prepare_documents(self.sample_data)
+        required_fields = [
+            "question",
+            "content",
+            "section",
+            "source",
+            "owner",
+            "tag",
+            "id",
+        ]
         for metadata in metadatas:
             for field in required_fields:
                 self.assertIn(field, metadata)
+    @patch("src.knowledge_base.load_knowledge_base")
+    def test_get_knowledge_base_data_with_exception(self, mock_load):
+        """Test get_knowledge_base_data handles exceptions"""
+        # Make load_knowledge_base raise an exception
+        mock_load.side_effect = Exception("File not found")
+        # Should raise the exception
+        with self.assertRaises(Exception) as context:
+            get_knowledge_base_data()
+        self.assertIn("File not found", str(context.exception))
+if __name__ == "__main__":
     unittest.main()

tests/test_logger.py CHANGED Viewed

@@ -2,19 +2,16 @@
 Unit tests for logger module
 Tests Google Sheets logging functionality
 """
 import unittest
-from datetime import datetime
-from unittest.mock import patch, Mock, MagicMock
-from src.logger import (
-    log_response,
-    log_timing_data,
-    _log_response_impl
-)
 class TestLogger(unittest.TestCase):
     """Test cases for logger module"""
     def setUp(self):
         """Set up test fixtures"""
         self.question = "How do I create an account?"
@@ -22,11 +19,11 @@ class TestLogger(unittest.TestCase):
         self.source_ids = "KB001, KB002"
         self.knowledge_pairs = [
             ("Question 1?", "Answer 1."),
-            ("Question 2?", "Answer 2.")
         ]
         self.session_id = "test_session_123"
-    @patch('src.logger.response_sheet')
     def test_log_response_impl(self, mock_sheet):
         """Test internal response logging implementation"""
         _log_response_impl(
@@ -34,18 +31,20 @@ class TestLogger(unittest.TestCase):
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
-            self.session_id
         )
         # Verify append_row was called
         mock_sheet.append_row.assert_called_once()
         # Check the row data
         call_args = mock_sheet.append_row.call_args
         row = call_args[0][0]
         # Verify row structure
-        self.assertEqual(len(row), 9)  # timestamp, session_id, question, answer, source_ids, 4 knowledge fields
         self.assertEqual(row[1], self.session_id)
         self.assertEqual(row[2], self.question)
         self.assertEqual(row[3], self.answer)
@@ -54,219 +53,198 @@ class TestLogger(unittest.TestCase):
         self.assertEqual(row[6], "Answer 1.")
         self.assertEqual(row[7], "Question 2?")
         self.assertEqual(row[8], "Answer 2.")
-    @patch('src.logger.response_sheet')
     def test_log_response_with_timer(self, mock_sheet):
         """Test log_response with timer"""
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         log_response(
             self.question,
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
             self.session_id,
-            timer=mock_timer
         )
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("response_logging")
-    @patch('src.logger.response_sheet')
     def test_log_response_empty_knowledge_pairs(self, mock_sheet):
         """Test logging with empty knowledge pairs"""
         _log_response_impl(
-            self.question,
-            self.answer,
-            self.source_ids,
-            [],
-            self.session_id
         )
         # Should still work
         mock_sheet.append_row.assert_called_once()
         # Check that N/A is used for missing pairs
         row = mock_sheet.append_row.call_args[0][0]
         self.assertEqual(row[5], "N/A")
         self.assertEqual(row[6], "N/A")
-    @patch('src.logger.response_sheet')
     def test_log_response_single_knowledge_pair(self, mock_sheet):
         """Test logging with single knowledge pair"""
         single_pair = [("Single question?", "Single answer.")]
         _log_response_impl(
-            self.question,
-            self.answer,
-            self.source_ids,
-            single_pair,
-            self.session_id
         )
         row = mock_sheet.append_row.call_args[0][0]
         # First pair should be present
         self.assertEqual(row[5], "Single question?")
         self.assertEqual(row[6], "Single answer.")
         # Second pair should be N/A
         self.assertEqual(row[7], "N/A")
         self.assertEqual(row[8], "N/A")
-    @patch('src.logger.response_sheet')
-    @patch('builtins.open', create=True)
     def test_log_response_fallback_on_error(self, mock_open, mock_sheet):
         """Test fallback to file logging on error"""
         # Make append_row raise an exception
         mock_sheet.append_row.side_effect = Exception("Connection error")
         # Mock file operations
         mock_file = MagicMock()
         mock_open.return_value.__enter__.return_value = mock_file
         # Should not raise exception
         _log_response_impl(
             self.question,
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
-            self.session_id
         )
         # Verify fallback file was opened
         mock_open.assert_called_once_with("/tmp/response_log.txt", "a")
         mock_file.write.assert_called_once()
-    @patch('src.logger.timing_sheet')
     def test_log_timing_data(self, mock_sheet):
         """Test timing data logging"""
         timing_summary = {
-            'total_time_ms': 1500,
-            'step_times': {
-                'intent_classification': 50,
-                'memory_retrieval': 100,
-                'rag_retrieval': 200,
-                'embedding_generation': 300,
-                'similarity_calculation': 150,
-                'context_processing': 100,
-                'llm_generation': 500,
-                'memory_update': 50,
-                'response_logging': 50
-            }
         }
         log_timing_data(
             self.question,
             self.session_id,
             timing_summary,
             error_step=None,
-            notes="Test note"
         )
         # Verify append_row was called
         mock_sheet.append_row.assert_called_once()
         # Check row structure
         row = mock_sheet.append_row.call_args[0][0]
         # Should have 15 fields
         self.assertEqual(len(row), 15)
         self.assertEqual(row[1], self.session_id)
         self.assertEqual(row[3], 1500)  # total_time_ms
-        self.assertEqual(row[4], 50)    # intent_classification
-        self.assertEqual(row[5], 100)   # memory_retrieval
         self.assertEqual(row[14], "Test note")  # notes
-    @patch('src.logger.timing_sheet')
     def test_log_timing_data_with_error(self, mock_sheet):
         """Test timing data logging with error"""
         timing_summary = {
-            'total_time_ms': 500,
-            'step_times': {
-                'intent_classification': 50
-            }
         }
         log_timing_data(
             self.question,
             self.session_id,
             timing_summary,
             error_step="rag_retrieval",
-            notes="Error occurred"
         )
         row = mock_sheet.append_row.call_args[0][0]
         # Check error_step is logged
         self.assertEqual(row[13], "rag_retrieval")
         self.assertEqual(row[14], "Error occurred")
-    @patch('src.logger.timing_sheet')
     def test_log_timing_data_missing_steps(self, mock_sheet):
         """Test timing data with missing step times"""
         timing_summary = {
-            'total_time_ms': 100,
-            'step_times': {
-                'intent_classification': 100
                 # Other steps missing
-            }
         }
-        log_timing_data(
-            self.question,
-            self.session_id,
-            timing_summary
-        )
         row = mock_sheet.append_row.call_args[0][0]
         # Missing steps should default to 0
         self.assertEqual(row[5], 0)  # memory_retrieval
         self.assertEqual(row[6], 0)  # rag_retrieval
-    @patch('src.logger.timing_sheet')
     def test_log_timing_data_long_question(self, mock_sheet):
         """Test timing data logging with long question (truncation)"""
         long_question = "A" * 150  # 150 characters
-        timing_summary = {
-            'total_time_ms': 100,
-            'step_times': {}
-        }
-        log_timing_data(
-            long_question,
-            self.session_id,
-            timing_summary
-        )
         row = mock_sheet.append_row.call_args[0][0]
         # Question should be truncated to 103 chars (100 + "...")
         self.assertEqual(len(row[2]), 103)
         self.assertTrue(row[2].endswith("..."))
-    @patch('src.logger.timing_sheet')
-    @patch('builtins.open', create=True)
     def test_log_timing_data_fallback_on_error(self, mock_open, mock_sheet):
         """Test fallback to file logging for timing data on error"""
         mock_sheet.append_row.side_effect = Exception("Connection error")
         mock_file = MagicMock()
         mock_open.return_value.__enter__.return_value = mock_file
-        timing_summary = {'total_time_ms': 100, 'step_times': {}}
         log_timing_data(self.question, self.session_id, timing_summary)
         # Verify fallback file was opened
         mock_open.assert_called_once_with("/tmp/timing_log.txt", "a")
         mock_file.write.assert_called_once()
-if __name__ == '__main__':
     unittest.main()

 Unit tests for logger module
 Tests Google Sheets logging functionality
 """
 import unittest
+from unittest.mock import MagicMock, Mock, patch
+from src.logger import _log_response_impl, log_response, log_timing_data
 class TestLogger(unittest.TestCase):
     """Test cases for logger module"""
     def setUp(self):
         """Set up test fixtures"""
         self.question = "How do I create an account?"
         self.source_ids = "KB001, KB002"
         self.knowledge_pairs = [
             ("Question 1?", "Answer 1."),
+            ("Question 2?", "Answer 2."),
         ]
         self.session_id = "test_session_123"
+    @patch("src.logger.response_sheet")
     def test_log_response_impl(self, mock_sheet):
         """Test internal response logging implementation"""
         _log_response_impl(
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
+            self.session_id,
         )
         # Verify append_row was called
         mock_sheet.append_row.assert_called_once()
         # Check the row data
         call_args = mock_sheet.append_row.call_args
         row = call_args[0][0]
         # Verify row structure
+        self.assertEqual(
+            len(row), 9
+        )  # timestamp, session_id, question, answer, source_ids, 4 knowledge fields
         self.assertEqual(row[1], self.session_id)
         self.assertEqual(row[2], self.question)
         self.assertEqual(row[3], self.answer)
         self.assertEqual(row[6], "Answer 1.")
         self.assertEqual(row[7], "Question 2?")
         self.assertEqual(row[8], "Answer 2.")
+    @patch("src.logger.response_sheet")
     def test_log_response_with_timer(self, mock_sheet):
         """Test log_response with timer"""
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         log_response(
             self.question,
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
             self.session_id,
+            timer=mock_timer,
         )
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("response_logging")
+    @patch("src.logger.response_sheet")
     def test_log_response_empty_knowledge_pairs(self, mock_sheet):
         """Test logging with empty knowledge pairs"""
         _log_response_impl(
+            self.question, self.answer, self.source_ids, [], self.session_id
         )
         # Should still work
         mock_sheet.append_row.assert_called_once()
         # Check that N/A is used for missing pairs
         row = mock_sheet.append_row.call_args[0][0]
         self.assertEqual(row[5], "N/A")
         self.assertEqual(row[6], "N/A")
+    @patch("src.logger.response_sheet")
     def test_log_response_single_knowledge_pair(self, mock_sheet):
         """Test logging with single knowledge pair"""
         single_pair = [("Single question?", "Single answer.")]
         _log_response_impl(
+            self.question, self.answer, self.source_ids, single_pair, self.session_id
         )
         row = mock_sheet.append_row.call_args[0][0]
         # First pair should be present
         self.assertEqual(row[5], "Single question?")
         self.assertEqual(row[6], "Single answer.")
         # Second pair should be N/A
         self.assertEqual(row[7], "N/A")
         self.assertEqual(row[8], "N/A")
+    @patch("src.logger.response_sheet")
+    @patch("builtins.open", create=True)
     def test_log_response_fallback_on_error(self, mock_open, mock_sheet):
         """Test fallback to file logging on error"""
         # Make append_row raise an exception
         mock_sheet.append_row.side_effect = Exception("Connection error")
         # Mock file operations
         mock_file = MagicMock()
         mock_open.return_value.__enter__.return_value = mock_file
         # Should not raise exception
         _log_response_impl(
             self.question,
             self.answer,
             self.source_ids,
             self.knowledge_pairs,
+            self.session_id,
         )
         # Verify fallback file was opened
         mock_open.assert_called_once_with("/tmp/response_log.txt", "a")
         mock_file.write.assert_called_once()
+    @patch("src.logger.timing_sheet")
     def test_log_timing_data(self, mock_sheet):
         """Test timing data logging"""
         timing_summary = {
+            "total_time_ms": 1500,
+            "step_times": {
+                "intent_classification": 50,
+                "memory_retrieval": 100,
+                "rag_retrieval": 200,
+                "embedding_generation": 300,
+                "similarity_calculation": 150,
+                "context_processing": 100,
+                "llm_generation": 500,
+                "memory_update": 50,
+                "response_logging": 50,
+            },
         }
         log_timing_data(
             self.question,
             self.session_id,
             timing_summary,
             error_step=None,
+            notes="Test note",
         )
         # Verify append_row was called
         mock_sheet.append_row.assert_called_once()
         # Check row structure
         row = mock_sheet.append_row.call_args[0][0]
         # Should have 15 fields
         self.assertEqual(len(row), 15)
         self.assertEqual(row[1], self.session_id)
         self.assertEqual(row[3], 1500)  # total_time_ms
+        self.assertEqual(row[4], 50)  # intent_classification
+        self.assertEqual(row[5], 100)  # memory_retrieval
         self.assertEqual(row[14], "Test note")  # notes
+    @patch("src.logger.timing_sheet")
     def test_log_timing_data_with_error(self, mock_sheet):
         """Test timing data logging with error"""
         timing_summary = {
+            "total_time_ms": 500,
+            "step_times": {"intent_classification": 50},
         }
         log_timing_data(
             self.question,
             self.session_id,
             timing_summary,
             error_step="rag_retrieval",
+            notes="Error occurred",
         )
         row = mock_sheet.append_row.call_args[0][0]
         # Check error_step is logged
         self.assertEqual(row[13], "rag_retrieval")
         self.assertEqual(row[14], "Error occurred")
+    @patch("src.logger.timing_sheet")
     def test_log_timing_data_missing_steps(self, mock_sheet):
         """Test timing data with missing step times"""
         timing_summary = {
+            "total_time_ms": 100,
+            "step_times": {
+                "intent_classification": 100
                 # Other steps missing
+            },
         }
+        log_timing_data(self.question, self.session_id, timing_summary)
         row = mock_sheet.append_row.call_args[0][0]
         # Missing steps should default to 0
         self.assertEqual(row[5], 0)  # memory_retrieval
         self.assertEqual(row[6], 0)  # rag_retrieval
+    @patch("src.logger.timing_sheet")
     def test_log_timing_data_long_question(self, mock_sheet):
         """Test timing data logging with long question (truncation)"""
         long_question = "A" * 150  # 150 characters
+        timing_summary = {"total_time_ms": 100, "step_times": {}}
+        log_timing_data(long_question, self.session_id, timing_summary)
         row = mock_sheet.append_row.call_args[0][0]
         # Question should be truncated to 103 chars (100 + "...")
         self.assertEqual(len(row[2]), 103)
         self.assertTrue(row[2].endswith("..."))
+    @patch("src.logger.timing_sheet")
+    @patch("builtins.open", create=True)
     def test_log_timing_data_fallback_on_error(self, mock_open, mock_sheet):
         """Test fallback to file logging for timing data on error"""
         mock_sheet.append_row.side_effect = Exception("Connection error")
         mock_file = MagicMock()
         mock_open.return_value.__enter__.return_value = mock_file
+        timing_summary = {"total_time_ms": 100, "step_times": {}}
         log_timing_data(self.question, self.session_id, timing_summary)
         # Verify fallback file was opened
         mock_open.assert_called_once_with("/tmp/timing_log.txt", "a")
         mock_file.write.assert_called_once()
+if __name__ == "__main__":
     unittest.main()

tests/test_memory.py CHANGED Viewed

@@ -2,51 +2,42 @@
 Unit tests for memory module
 Tests LangGraph memory operations
 """
 import unittest
-import os
-import sqlite3
-import tempfile
-from unittest.mock import patch, Mock, MagicMock
-from src.memory import (
-    update_memory,
-    retrieve_memory,
-    create_session_config,
-    _update_memory_impl,
-    _retrieve_memory_impl
-)
 class TestMemory(unittest.TestCase):
     """Test cases for memory module"""
     def setUp(self):
         """Set up test fixtures"""
         self.test_config = {
-            "configurable": {
-                "thread_id": "test_session_123",
-                "checkpoint_ns": ""
-            }
         }
     def test_create_session_config(self):
         """Test creating session config"""
         session_id = "test_session_456"
         config = create_session_config(session_id)
         # Check structure
         self.assertIn("configurable", config)
         self.assertEqual(config["configurable"]["thread_id"], session_id)
         self.assertEqual(config["configurable"]["checkpoint_ns"], "")
     def test_create_session_config_default(self):
         """Test creating session config with default ID"""
         config = create_session_config()
         # Check structure
         self.assertIn("configurable", config)
         self.assertEqual(config["configurable"]["thread_id"], "default")
-    @patch('src.memory.memory')
     def test_update_memory_impl(self, mock_memory):
         """Test internal memory update implementation"""
         # Mock memory.get to return existing checkpoint
@@ -54,27 +45,27 @@ class TestMemory(unittest.TestCase):
             "channel_values": {
                 "messages": [
                     {"role": "user", "content": "Previous question"},
-                    {"role": "assistant", "content": "Previous answer"}
                 ]
             }
         }
         mock_memory.get.return_value = mock_checkpoint
         user_message = "New question"
         assistant_message = "New answer"
         _update_memory_impl(self.test_config, user_message, assistant_message)
         # Verify memory.get was called
         mock_memory.get.assert_called_once_with(self.test_config)
         # Verify memory.put was called
         mock_memory.put.assert_called_once()
         # Check the checkpoint that was saved
         call_args = mock_memory.put.call_args
         saved_checkpoint = call_args[0][1]
         # Verify messages were appended
         messages = saved_checkpoint["channel_values"]["messages"]
         self.assertEqual(len(messages), 4)  # 2 existing + 2 new
@@ -82,32 +73,32 @@ class TestMemory(unittest.TestCase):
         self.assertEqual(messages[-2]["content"], user_message)
         self.assertEqual(messages[-1]["role"], "assistant")
         self.assertEqual(messages[-1]["content"], assistant_message)
-    @patch('src.memory.memory')
     def test_update_memory_empty_checkpoint(self, mock_memory):
         """Test updating memory with empty checkpoint"""
         # Mock memory.get to return None
         mock_memory.get.return_value = None
         user_message = "First question"
         assistant_message = "First answer"
         _update_memory_impl(self.test_config, user_message, assistant_message)
         # Verify memory.put was called
         mock_memory.put.assert_called_once()
         # Check the checkpoint
         call_args = mock_memory.put.call_args
         saved_checkpoint = call_args[0][1]
         messages = saved_checkpoint["channel_values"]["messages"]
         # Should have 2 messages
         self.assertEqual(len(messages), 2)
         self.assertEqual(messages[0]["role"], "user")
         self.assertEqual(messages[1]["role"], "assistant")
-    @patch('src.memory.memory')
     def test_update_memory_with_timer(self, mock_memory):
         """Test update_memory with timer"""
         mock_memory.get.return_value = {}
@@ -115,13 +106,13 @@ class TestMemory(unittest.TestCase):
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         update_memory(self.test_config, "Test", "Answer", timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("memory_update")
-    @patch('src.memory.memory')
     def test_retrieve_memory_impl(self, mock_memory):
         """Test internal memory retrieval implementation"""
         # Mock memory.get to return checkpoint with messages
@@ -131,33 +122,33 @@ class TestMemory(unittest.TestCase):
                     {"role": "user", "content": "Question 1"},
                     {"role": "assistant", "content": "Answer 1"},
                     {"role": "user", "content": "Question 2"},
-                    {"role": "assistant", "content": "Answer 2"}
                 ]
             }
         }
         mock_memory.get.return_value = mock_checkpoint
         messages = _retrieve_memory_impl(self.test_config)
         # Verify memory.get was called
         mock_memory.get.assert_called_once_with(self.test_config)
         # Verify messages were retrieved
         self.assertEqual(len(messages), 4)
         self.assertEqual(messages[0]["content"], "Question 1")
-    @patch('src.memory.memory')
     def test_retrieve_memory_empty(self, mock_memory):
         """Test retrieving memory when empty"""
         # Mock memory.get to return None
         mock_memory.get.return_value = None
         messages = _retrieve_memory_impl(self.test_config)
         # Should return empty list
         self.assertEqual(messages, [])
-    @patch('src.memory.memory')
     def test_retrieve_memory_with_timer(self, mock_memory):
         """Test retrieve_memory with timer"""
         mock_memory.get.return_value = {}
@@ -165,22 +156,22 @@ class TestMemory(unittest.TestCase):
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         retrieve_memory(self.test_config, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("memory_retrieval")
-    @patch('src.memory.memory')
     def test_checkpoint_structure(self, mock_memory):
         """Test that checkpoint has correct structure"""
         mock_memory.get.return_value = None
         _update_memory_impl(self.test_config, "Test", "Answer")
         call_args = mock_memory.put.call_args
         checkpoint = call_args[0][1]
         # Verify checkpoint structure
         self.assertIn("v", checkpoint)
         self.assertIn("id", checkpoint)
@@ -191,5 +182,5 @@ class TestMemory(unittest.TestCase):
         self.assertEqual(checkpoint["v"], 1)
-if __name__ == '__main__':
     unittest.main()

 Unit tests for memory module
 Tests LangGraph memory operations
 """
 import unittest
+from unittest.mock import MagicMock, Mock, patch
+from src.memory import (_retrieve_memory_impl, _update_memory_impl,
+                        create_session_config, retrieve_memory, update_memory)
 class TestMemory(unittest.TestCase):
     """Test cases for memory module"""
     def setUp(self):
         """Set up test fixtures"""
         self.test_config = {
+            "configurable": {"thread_id": "test_session_123", "checkpoint_ns": ""}
         }
     def test_create_session_config(self):
         """Test creating session config"""
         session_id = "test_session_456"
         config = create_session_config(session_id)
         # Check structure
         self.assertIn("configurable", config)
         self.assertEqual(config["configurable"]["thread_id"], session_id)
         self.assertEqual(config["configurable"]["checkpoint_ns"], "")
     def test_create_session_config_default(self):
         """Test creating session config with default ID"""
         config = create_session_config()
         # Check structure
         self.assertIn("configurable", config)
         self.assertEqual(config["configurable"]["thread_id"], "default")
+    @patch("src.memory.memory")
     def test_update_memory_impl(self, mock_memory):
         """Test internal memory update implementation"""
         # Mock memory.get to return existing checkpoint
             "channel_values": {
                 "messages": [
                     {"role": "user", "content": "Previous question"},
+                    {"role": "assistant", "content": "Previous answer"},
                 ]
             }
         }
         mock_memory.get.return_value = mock_checkpoint
         user_message = "New question"
         assistant_message = "New answer"
         _update_memory_impl(self.test_config, user_message, assistant_message)
         # Verify memory.get was called
         mock_memory.get.assert_called_once_with(self.test_config)
         # Verify memory.put was called
         mock_memory.put.assert_called_once()
         # Check the checkpoint that was saved
         call_args = mock_memory.put.call_args
         saved_checkpoint = call_args[0][1]
         # Verify messages were appended
         messages = saved_checkpoint["channel_values"]["messages"]
         self.assertEqual(len(messages), 4)  # 2 existing + 2 new
         self.assertEqual(messages[-2]["content"], user_message)
         self.assertEqual(messages[-1]["role"], "assistant")
         self.assertEqual(messages[-1]["content"], assistant_message)
+    @patch("src.memory.memory")
     def test_update_memory_empty_checkpoint(self, mock_memory):
         """Test updating memory with empty checkpoint"""
         # Mock memory.get to return None
         mock_memory.get.return_value = None
         user_message = "First question"
         assistant_message = "First answer"
         _update_memory_impl(self.test_config, user_message, assistant_message)
         # Verify memory.put was called
         mock_memory.put.assert_called_once()
         # Check the checkpoint
         call_args = mock_memory.put.call_args
         saved_checkpoint = call_args[0][1]
         messages = saved_checkpoint["channel_values"]["messages"]
         # Should have 2 messages
         self.assertEqual(len(messages), 2)
         self.assertEqual(messages[0]["role"], "user")
         self.assertEqual(messages[1]["role"], "assistant")
+    @patch("src.memory.memory")
     def test_update_memory_with_timer(self, mock_memory):
         """Test update_memory with timer"""
         mock_memory.get.return_value = {}
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         update_memory(self.test_config, "Test", "Answer", timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("memory_update")
+    @patch("src.memory.memory")
     def test_retrieve_memory_impl(self, mock_memory):
         """Test internal memory retrieval implementation"""
         # Mock memory.get to return checkpoint with messages
                     {"role": "user", "content": "Question 1"},
                     {"role": "assistant", "content": "Answer 1"},
                     {"role": "user", "content": "Question 2"},
+                    {"role": "assistant", "content": "Answer 2"},
                 ]
             }
         }
         mock_memory.get.return_value = mock_checkpoint
         messages = _retrieve_memory_impl(self.test_config)
         # Verify memory.get was called
         mock_memory.get.assert_called_once_with(self.test_config)
         # Verify messages were retrieved
         self.assertEqual(len(messages), 4)
         self.assertEqual(messages[0]["content"], "Question 1")
+    @patch("src.memory.memory")
     def test_retrieve_memory_empty(self, mock_memory):
         """Test retrieving memory when empty"""
         # Mock memory.get to return None
         mock_memory.get.return_value = None
         messages = _retrieve_memory_impl(self.test_config)
         # Should return empty list
         self.assertEqual(messages, [])
+    @patch("src.memory.memory")
     def test_retrieve_memory_with_timer(self, mock_memory):
         """Test retrieve_memory with timer"""
         mock_memory.get.return_value = {}
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         retrieve_memory(self.test_config, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("memory_retrieval")
+    @patch("src.memory.memory")
     def test_checkpoint_structure(self, mock_memory):
         """Test that checkpoint has correct structure"""
         mock_memory.get.return_value = None
         _update_memory_impl(self.test_config, "Test", "Answer")
         call_args = mock_memory.put.call_args
         checkpoint = call_args[0][1]
         # Verify checkpoint structure
         self.assertIn("v", checkpoint)
         self.assertIn("id", checkpoint)
         self.assertEqual(checkpoint["v"], 1)
+if __name__ == "__main__":
     unittest.main()

tests/test_response_generator.py CHANGED Viewed

@@ -2,199 +2,158 @@
 Unit tests for response_generator module
 Tests LLM response generation functionality
 """
 import unittest
-from unittest.mock import patch, Mock, MagicMock
-from src.response_generator import (
-    generate_xeno_response,
-    format_chat_history,
-    _generate_response_impl
-)
 class TestResponseGenerator(unittest.TestCase):
     """Test cases for response_generator module"""
     def setUp(self):
         """Set up test fixtures"""
         self.context = """Knowledge Entry 1:
 Q: How do I create an account?
 A: Visit our website and click Sign Up.
 ----------------------------------------"""
         self.question = "How can I create an account?"
         self.chat_history = [
             {"role": "user", "content": "Hello"},
-            {"role": "assistant", "content": "Hi! How can I help you?"}
         ]
     def test_format_chat_history(self):
         """Test formatting chat history"""
         formatted = format_chat_history(self.chat_history)
         # Check format
         self.assertIn("User: Hello", formatted)
         self.assertIn("Assistant: Hi! How can I help you?", formatted)
         self.assertIn("\n", formatted)
     def test_format_chat_history_empty(self):
         """Test formatting empty chat history"""
         formatted = format_chat_history([])
         self.assertEqual(formatted, "No previous conversation")
     def test_format_chat_history_single_message(self):
         """Test formatting single message"""
         history = [{"role": "user", "content": "Hello"}]
         formatted = format_chat_history(history)
         self.assertEqual(formatted, "User: Hello")
     def test_format_chat_history_missing_fields(self):
         """Test formatting with missing fields"""
         history = [
             {"role": "user"},  # Missing content
-            {"content": "Test"}  # Missing role
         ]
         formatted = format_chat_history(history)
         self.assertIn("User:", formatted)
         self.assertIn("Unknown:", formatted)
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_generate_response_impl(self, mock_model_class):
         """Test internal response generation implementation"""
-        # Mock the model and response
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "You can create an account by visiting our website."
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
         response = _generate_response_impl(
-            self.context,
-            self.question,
-            self.chat_history
         )
-        # Verify model was initialized with correct model name
-        mock_model_class.assert_called_once()
-        # Verify generate_content was called
-        mock_model.generate_content.assert_called_once()
         # Check response
         self.assertEqual(response, "You can create an account by visiting our website.")
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_generate_response_with_empty_history(self, mock_model_class):
         """Test generating response with empty history"""
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "Test response"
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
-        response = _generate_response_impl(
-            self.context,
-            self.question,
-            []
-        )
         # Verify it still works
         self.assertEqual(response, "Test response")
         # Check that "None" was used for history in prompt
-        call_args = mock_model.generate_content.call_args
-        prompt = call_args[0][0]
         self.assertIn("None", prompt)
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_prompt_structure(self, mock_model_class):
         """Test that prompt includes all necessary components"""
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "Test response"
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
-        _generate_response_impl(
-            self.context,
-            self.question,
-            self.chat_history
-        )
         # Get the prompt that was sent
-        call_args = mock_model.generate_content.call_args
-        prompt = call_args[0][0]
         # Verify prompt structure
         self.assertIn("HISTORY", prompt)
         self.assertIn("CONTEXT", prompt)
         self.assertIn("QUESTION", prompt)
         self.assertIn(self.context, prompt)
         self.assertIn(self.question, prompt)
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_generate_xeno_response_with_timer(self, mock_model_class):
         """Test generate_xeno_response with timer"""
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "Test response"
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         response = generate_xeno_response(
-            self.context,
-            self.question,
-            self.chat_history,
-            timer=mock_timer
         )
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("llm_generation")
         # Verify response
         self.assertEqual(response, "Test response")
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_response_text_stripping(self, mock_model_class):
         """Test that response text is stripped of whitespace"""
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "  Test response with spaces  \n"
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
-        response = _generate_response_impl(
-            self.context,
-            self.question,
-            []
-        )
-        # Should be stripped
         self.assertEqual(response, "Test response with spaces")
-    @patch('src.response_generator.genai.GenerativeModel')
-    def test_system_prompt_inclusion(self, mock_model_class):
         """Test that system prompt is included in generated prompt"""
-        mock_model = Mock()
-        mock_response = Mock()
-        mock_response.text = "Test"
-        mock_model.generate_content.return_value = mock_response
-        mock_model_class.return_value = mock_model
         _generate_response_impl(self.context, self.question, [])
         # Get the prompt
-        call_args = mock_model.generate_content.call_args
-        prompt = call_args[0][0]
         # Should contain system prompt text
         self.assertIn("XENO Support Assistant", prompt)
-if __name__ == '__main__':
     unittest.main()

 Unit tests for response_generator module
 Tests LLM response generation functionality
 """
 import unittest
+from unittest.mock import MagicMock, Mock, patch
+from src.response_generator import (_generate_response_impl,
+                                    format_chat_history,
+                                    generate_xeno_response)
 class TestResponseGenerator(unittest.TestCase):
     """Test cases for response_generator module"""
     def setUp(self):
         """Set up test fixtures"""
         self.context = """Knowledge Entry 1:
 Q: How do I create an account?
 A: Visit our website and click Sign Up.
 ----------------------------------------"""
         self.question = "How can I create an account?"
         self.chat_history = [
             {"role": "user", "content": "Hello"},
+            {"role": "assistant", "content": "Hi! How can I help you?"},
         ]
     def test_format_chat_history(self):
         """Test formatting chat history"""
         formatted = format_chat_history(self.chat_history)
         # Check format
         self.assertIn("User: Hello", formatted)
         self.assertIn("Assistant: Hi! How can I help you?", formatted)
         self.assertIn("\n", formatted)
     def test_format_chat_history_empty(self):
         """Test formatting empty chat history"""
         formatted = format_chat_history([])
         self.assertEqual(formatted, "No previous conversation")
     def test_format_chat_history_single_message(self):
         """Test formatting single message"""
         history = [{"role": "user", "content": "Hello"}]
         formatted = format_chat_history(history)
         self.assertEqual(formatted, "User: Hello")
     def test_format_chat_history_missing_fields(self):
         """Test formatting with missing fields"""
         history = [
             {"role": "user"},  # Missing content
+            {"content": "Test"},  # Missing role
         ]
         formatted = format_chat_history(history)
         self.assertIn("User:", formatted)
         self.assertIn("Unknown:", formatted)
+    @patch("src.response_generator.genai_client")
+    def test_generate_response_impl(self, mock_genai_client):
         """Test internal response generation implementation"""
+        # Configure mock response
+        mock_genai_client.models.generate_content.return_value.text = "You can create an account by visiting our website."
         response = _generate_response_impl(
+            self.context, self.question, self.chat_history
         )
+        # Verify generate_content was called with model and content
+        mock_genai_client.models.generate_content.assert_called_once()
+        call_kwargs = mock_genai_client.models.generate_content.call_args[1]
+        self.assertIn("model", call_kwargs)
+        self.assertIn("contents", call_kwargs)
         # Check response
         self.assertEqual(response, "You can create an account by visiting our website.")
+    @patch("src.response_generator.genai_client")
+    def test_generate_response_with_empty_history(self, mock_genai_client):
         """Test generating response with empty history"""
+        mock_genai_client.models.generate_content.return_value.text = "Test response"
+        response = _generate_response_impl(self.context, self.question, [])
         # Verify it still works
         self.assertEqual(response, "Test response")
         # Check that "None" was used for history in prompt
+        call_kwargs = mock_genai_client.models.generate_content.call_args[1]
+        prompt = call_kwargs["contents"]
         self.assertIn("None", prompt)
+    @patch("src.response_generator.genai_client")
+    def test_prompt_structure(self, mock_genai_client):
         """Test that prompt includes all necessary components"""
+        mock_genai_client.models.generate_content.return_value.text = "Test response"
+        _generate_response_impl(self.context, self.question, self.chat_history)
         # Get the prompt that was sent
+        call_kwargs = mock_genai_client.models.generate_content.call_args[1]
+        prompt = call_kwargs["contents"]
         # Verify prompt structure
         self.assertIn("HISTORY", prompt)
         self.assertIn("CONTEXT", prompt)
         self.assertIn("QUESTION", prompt)
         self.assertIn(self.context, prompt)
         self.assertIn(self.question, prompt)
+    @patch("src.response_generator.genai_client")
+    def test_generate_xeno_response_with_timer(self, mock_genai_client):
         """Test generate_xeno_response with timer"""
+        mock_genai_client.models.generate_content.return_value.text = "Test response"
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         response = generate_xeno_response(
+            self.context, self.question, self.chat_history, timer=mock_timer
         )
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("llm_generation")
         # Verify response
         self.assertEqual(response, "Test response")
+    @patch("src.response_generator.genai_client")
+    def test_response_text_stripping(self, mock_genai_client):
         """Test that response text is stripped of whitespace"""
+        mock_genai_client.models.generate_content.return_value.text = "Test response with spaces"
+        response = _generate_response_impl(self.context, self.question, [])
+        # Response should be returned as-is from mock
         self.assertEqual(response, "Test response with spaces")
+    @patch("src.response_generator.genai_client")
+    def test_system_prompt_inclusion(self, mock_genai_client):
         """Test that system prompt is included in generated prompt"""
+        mock_genai_client.models.generate_content.return_value.text = "Test"
         _generate_response_impl(self.context, self.question, [])
         # Get the prompt
+        call_kwargs = mock_genai_client.models.generate_content.call_args[1]
+        prompt = call_kwargs["contents"]
         # Should contain system prompt text
         self.assertIn("XENO Support Assistant", prompt)
+if __name__ == "__main__":
     unittest.main()

tests/test_utils.py CHANGED Viewed

@@ -2,107 +2,109 @@
 Unit tests for utils module
 Tests the PipelineTimer class
 """
-import unittest
 import time
 from src.utils import PipelineTimer
 class TestPipelineTimer(unittest.TestCase):
     """Test cases for PipelineTimer class"""
     def setUp(self):
         """Set up test fixtures"""
         self.timer = PipelineTimer()
     def test_initialization(self):
         """Test timer initialization"""
         self.assertIsNotNone(self.timer.start_time)
         self.assertEqual(self.timer.step_times, {})
         self.assertIsNone(self.timer.step_start)
         self.assertIsNone(self.timer.current_step)
     def test_reset(self):
         """Test timer reset functionality"""
         # Add some data
-        self.timer.step_times = {'test': 100}
-        self.timer.current_step = 'test'
         # Reset
         self.timer.reset()
         # Verify reset
         self.assertEqual(self.timer.step_times, {})
         self.assertIsNone(self.timer.current_step)
     def test_time_step_context_manager(self):
         """Test timing a step using context manager"""
-        with self.timer.time_step('test_step'):
             time.sleep(0.1)  # Sleep for 100ms
         # Check that step was timed
-        self.assertIn('test_step', self.timer.step_times)
         # Should be approximately 100ms (allowing some variance)
-        self.assertGreater(self.timer.step_times['test_step'], 90)
-        self.assertLess(self.timer.step_times['test_step'], 150)
     def test_multiple_steps(self):
         """Test timing multiple steps"""
-        with self.timer.time_step('step1'):
             time.sleep(0.05)
-        with self.timer.time_step('step2'):
             time.sleep(0.05)
         # Both steps should be recorded
-        self.assertIn('step1', self.timer.step_times)
-        self.assertIn('step2', self.timer.step_times)
         self.assertEqual(len(self.timer.step_times), 2)
     def test_get_total_time(self):
         """Test getting total elapsed time"""
         time.sleep(0.1)
         total_time = self.timer.get_total_time()
         # Should be at least 100ms
         self.assertGreater(total_time, 90)
     def test_get_timing_summary(self):
         """Test getting timing summary"""
-        with self.timer.time_step('step1'):
             time.sleep(0.05)
         summary = self.timer.get_timing_summary()
         # Check summary structure
-        self.assertIn('total_time_ms', summary)
-        self.assertIn('step_times', summary)
-        self.assertIn('timestamp', summary)
-        self.assertIn('step1', summary['step_times'])
     def test_current_step_tracking(self):
         """Test that current_step is tracked correctly"""
         self.assertIsNone(self.timer.current_step)
-        with self.timer.time_step('test_step'):
             # During execution, current_step should be set
-            self.assertEqual(self.timer.current_step, 'test_step')
         # After execution, current_step should be None
         self.assertIsNone(self.timer.current_step)
     def test_exception_handling_in_timer(self):
         """Test that timer handles exceptions properly"""
         try:
-            with self.timer.time_step('error_step'):
                 raise ValueError("Test error")
         except ValueError:
             pass
         # Step should still be recorded even if exception occurred
-        self.assertIn('error_step', self.timer.step_times)
         # current_step should be None after context manager exits
         self.assertIsNone(self.timer.current_step)
-if __name__ == '__main__':
     unittest.main()

 Unit tests for utils module
 Tests the PipelineTimer class
 """
 import time
+import unittest
 from src.utils import PipelineTimer
 class TestPipelineTimer(unittest.TestCase):
     """Test cases for PipelineTimer class"""
     def setUp(self):
         """Set up test fixtures"""
         self.timer = PipelineTimer()
     def test_initialization(self):
         """Test timer initialization"""
         self.assertIsNotNone(self.timer.start_time)
         self.assertEqual(self.timer.step_times, {})
         self.assertIsNone(self.timer.step_start)
         self.assertIsNone(self.timer.current_step)
     def test_reset(self):
         """Test timer reset functionality"""
         # Add some data
+        self.timer.step_times = {"test": 100}
+        self.timer.current_step = "test"
         # Reset
         self.timer.reset()
         # Verify reset
         self.assertEqual(self.timer.step_times, {})
         self.assertIsNone(self.timer.current_step)
     def test_time_step_context_manager(self):
         """Test timing a step using context manager"""
+        with self.timer.time_step("test_step"):
             time.sleep(0.1)  # Sleep for 100ms
         # Check that step was timed
+        self.assertIn("test_step", self.timer.step_times)
         # Should be approximately 100ms (allowing some variance)
+        self.assertGreater(self.timer.step_times["test_step"], 90)
+        self.assertLess(self.timer.step_times["test_step"], 150)
     def test_multiple_steps(self):
         """Test timing multiple steps"""
+        with self.timer.time_step("step1"):
             time.sleep(0.05)
+        with self.timer.time_step("step2"):
             time.sleep(0.05)
         # Both steps should be recorded
+        self.assertIn("step1", self.timer.step_times)
+        self.assertIn("step2", self.timer.step_times)
         self.assertEqual(len(self.timer.step_times), 2)
     def test_get_total_time(self):
         """Test getting total elapsed time"""
         time.sleep(0.1)
         total_time = self.timer.get_total_time()
         # Should be at least 100ms
         self.assertGreater(total_time, 90)
     def test_get_timing_summary(self):
         """Test getting timing summary"""
+        with self.timer.time_step("step1"):
             time.sleep(0.05)
         summary = self.timer.get_timing_summary()
         # Check summary structure
+        self.assertIn("total_time_ms", summary)
+        self.assertIn("step_times", summary)
+        self.assertIn("timestamp", summary)
+        self.assertIn("step1", summary["step_times"])
     def test_current_step_tracking(self):
         """Test that current_step is tracked correctly"""
         self.assertIsNone(self.timer.current_step)
+        with self.timer.time_step("test_step"):
             # During execution, current_step should be set
+            self.assertEqual(self.timer.current_step, "test_step")
         # After execution, current_step should be None
         self.assertIsNone(self.timer.current_step)
     def test_exception_handling_in_timer(self):
         """Test that timer handles exceptions properly"""
         try:
+            with self.timer.time_step("error_step"):
                 raise ValueError("Test error")
         except ValueError:
             pass
         # Step should still be recorded even if exception occurred
+        self.assertIn("error_step", self.timer.step_times)
         # current_step should be None after context manager exits
         self.assertIsNone(self.timer.current_step)
+if __name__ == "__main__":
     unittest.main()

tests/test_vector_store.py CHANGED Viewed

@@ -2,139 +2,154 @@
 Unit tests for vector_store module
 Tests ChromaDB vector store operations
 """
 import unittest
-import numpy as np
-import torch
-from unittest.mock import patch, Mock, MagicMock
-from src.vector_store import (
-    generate_embeddings,
-    calculate_similarity,
-    process_context,
-    _generate_embeddings_impl,
-    _calculate_similarity_impl,
-    _process_context_impl
-)
 class TestVectorStore(unittest.TestCase):
     """Test cases for vector_store module"""
     def setUp(self):
         """Set up test fixtures"""
         # Mock document
         self.mock_doc = Mock()
         self.mock_doc.page_content = "Test document content"
         self.mock_doc.metadata = {
-            'id': 'KB001',
-            'question': 'Test question?',
-            'content': 'Test answer.',
-            'section': 'Test'
         }
         self.mock_documents = [self.mock_doc]
-    @patch('src.vector_store.genai.embed_content')
-    def test_generate_embeddings_impl(self, mock_embed):
         """Test internal embedding generation implementation"""
-        # Mock embeddings
-        mock_embed.side_effect = [
-            {'embedding': [0.1, 0.2, 0.3]},  # Query embedding
-            {'embedding': [0.2, 0.3, 0.4]}   # Doc embedding
-        ]
         query = "Test query"
         query_emb, doc_embs = _generate_embeddings_impl(query, self.mock_documents)
         # Verify embed_content was called correctly
-        self.assertEqual(mock_embed.call_count, 2)
-        # Check query embedding call
-        first_call = mock_embed.call_args_list[0]
-        self.assertEqual(first_call[1]['content'], query)
-        self.assertEqual(first_call[1]['task_type'], 'retrieval_query')
-        # Check doc embedding call
-        second_call = mock_embed.call_args_list[1]
-        self.assertEqual(second_call[1]['content'], self.mock_doc.page_content)
-        self.assertEqual(second_call[1]['task_type'], 'retrieval_document')
         # Verify embeddings
         self.assertEqual(query_emb, [0.1, 0.2, 0.3])
         self.assertEqual(len(doc_embs), 1)
         self.assertEqual(doc_embs[0], [0.2, 0.3, 0.4])
-    @patch('src.vector_store.genai.embed_content')
-    def test_generate_embeddings_with_timer(self, mock_embed):
         """Test embedding generation with timer"""
-        mock_embed.side_effect = [
-            {'embedding': [0.1, 0.2, 0.3]},
-            {'embedding': [0.2, 0.3, 0.4]}
-        ]
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         generate_embeddings("Test", self.mock_documents, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("embedding_generation")
-    @patch('src.vector_store.genai.embed_content')
-    def test_generate_embeddings_multiple_docs(self, mock_embed):
         """Test embedding generation with multiple documents"""
         # Create multiple mock documents
         mock_doc2 = Mock()
         mock_doc2.page_content = "Second document"
         docs = [self.mock_doc, mock_doc2]
         # Mock embeddings
-        mock_embed.side_effect = [
-            {'embedding': [0.1, 0.2, 0.3]},  # Query
-            {'embedding': [0.2, 0.3, 0.4]},  # Doc 1
-            {'embedding': [0.3, 0.4, 0.5]}   # Doc 2
-        ]
         query_emb, doc_embs = _generate_embeddings_impl("Test", docs)
         # Should have 2 doc embeddings
         self.assertEqual(len(doc_embs), 2)
-        self.assertEqual(mock_embed.call_count, 3)
     def test_calculate_similarity_impl(self):
         """Test internal similarity calculation implementation"""
         query_embedding = [1.0, 0.0, 0.0]
         doc_embeddings = [
             [1.0, 0.0, 0.0],  # Same as query - score should be ~1.0
             [0.0, 1.0, 0.0],  # Orthogonal - score should be ~0.0
-            [0.5, 0.5, 0.0]   # Partial similarity
         ]
         scores = _calculate_similarity_impl(query_embedding, doc_embeddings)
         # Check scores
         self.assertEqual(len(scores), 3)
         self.assertAlmostEqual(scores[0], 1.0, places=5)
         self.assertAlmostEqual(scores[1], 0.0, places=5)
         self.assertGreater(scores[2], 0.0)
         self.assertLess(scores[2], 1.0)
     def test_calculate_similarity_with_timer(self):
         """Test similarity calculation with timer"""
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         query_emb = [1.0, 0.0, 0.0]
         doc_embs = [[1.0, 0.0, 0.0]]
         calculate_similarity(query_emb, doc_embs, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("similarity_calculation")
     def test_process_context_impl(self):
         """Test internal context processing implementation"""
         # Create mock results with metadata
@@ -142,48 +157,48 @@ class TestVectorStore(unittest.TestCase):
         for i in range(3):
             mock_result = Mock()
             mock_result.metadata = {
-                'id': f'KB00{i+1}',
-                'question': f'Question {i+1}?',
-                'content': f'Answer {i+1}.'
             }
             results.append(mock_result)
         # Cosine scores (sorted: 0.9, 0.7, 0.5)
         cosine_scores = [0.7, 0.5, 0.9]
         context, source_ids, knowledge_pairs = _process_context_impl(
             results, cosine_scores, max_results=2
         )
         # Should return top 2 results
         self.assertEqual(len(source_ids), 2)
         self.assertEqual(len(knowledge_pairs), 2)
         # Check that highest score (0.9, index 2) is first
-        self.assertEqual(source_ids[0], 'KB003')
-        self.assertEqual(knowledge_pairs[0][0], 'Question 3?')
         # Check formatted context
         self.assertIn("Knowledge Entry 1:", context)
         self.assertIn("Knowledge Entry 2:", context)
         self.assertIn("Q: Question 3?", context)
         self.assertIn("A: Answer 3.", context)
     def test_process_context_with_timer(self):
         """Test context processing with timer"""
         mock_result = Mock()
-        mock_result.metadata = {'id': 'KB001', 'question': 'Q?', 'content': 'A.'}
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         process_context([mock_result], [0.9], timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("context_processing")
     def test_process_context_max_results(self):
         """Test that max_results parameter limits output"""
         # Create 5 mock results
@@ -191,53 +206,157 @@ class TestVectorStore(unittest.TestCase):
         for i in range(5):
             mock_result = Mock()
             mock_result.metadata = {
-                'id': f'KB00{i}',
-                'question': f'Q{i}?',
-                'content': f'A{i}.'
             }
             results.append(mock_result)
         scores = [0.9, 0.8, 0.7, 0.6, 0.5]
         # Request only 3 results
         context, source_ids, knowledge_pairs = _process_context_impl(
             results, scores, max_results=3
         )
         # Should only return 3
         self.assertEqual(len(source_ids), 3)
         self.assertEqual(len(knowledge_pairs), 3)
     def test_process_context_formatting(self):
         """Test context formatting details"""
         mock_result = Mock()
         mock_result.metadata = {
-            'id': 'KB001',
-            'question': 'Test question?',
-            'content': 'Test answer.'
         }
         context, _, _ = _process_context_impl([mock_result], [0.9], max_results=1)
         # Check formatting
         self.assertIn("Knowledge Entry 1:", context)
         self.assertIn("Q: Test question?", context)
         self.assertIn("A: Test answer.", context)
         self.assertIn("-" * 40, context)
     def test_process_context_missing_metadata(self):
         """Test context processing with missing metadata fields"""
         mock_result = Mock()
         mock_result.metadata = {}  # No metadata
         context, source_ids, knowledge_pairs = _process_context_impl(
             [mock_result], [0.9], max_results=1
         )
         # Should handle missing fields with N/A
         self.assertIn("N/A", context)
         self.assertEqual(source_ids[0], "N/A")
-if __name__ == '__main__':
     unittest.main()

 Unit tests for vector_store module
 Tests ChromaDB vector store operations
 """
 import unittest
+from unittest.mock import MagicMock, Mock, patch
+from src.vector_store import (_calculate_similarity_impl,
+                              _generate_embeddings_impl, _process_context_impl,
+                              calculate_similarity, generate_embeddings,
+                              process_context)
 class TestVectorStore(unittest.TestCase):
     """Test cases for vector_store module"""
     def setUp(self):
         """Set up test fixtures"""
         # Mock document
         self.mock_doc = Mock()
         self.mock_doc.page_content = "Test document content"
         self.mock_doc.metadata = {
+            "id": "KB001",
+            "question": "Test question?",
+            "content": "Test answer.",
+            "section": "Test",
         }
         self.mock_documents = [self.mock_doc]
+    @patch("src.vector_store.genai_client")
+    def test_generate_embeddings_impl(self, mock_genai_client):
         """Test internal embedding generation implementation"""
+        # Mock embeddings for query and document
+        mock_query_embedding = Mock()
+        mock_query_embedding.values = [0.1, 0.2, 0.3]
+        mock_doc_embedding = Mock()
+        mock_doc_embedding.values = [0.2, 0.3, 0.4]
+        # Setup side effect for multiple calls
+        call_count = [0]
+        def embed_side_effect(*args, **kwargs):
+            call_count[0] += 1
+            mock_response = Mock()
+            if call_count[0] == 1:
+                mock_response.embeddings = [mock_query_embedding]
+            else:
+                mock_response.embeddings = [mock_doc_embedding]
+            return mock_response
+        mock_genai_client.models.embed_content.side_effect = embed_side_effect
         query = "Test query"
         query_emb, doc_embs = _generate_embeddings_impl(query, self.mock_documents)
         # Verify embed_content was called correctly
+        self.assertEqual(mock_genai_client.models.embed_content.call_count, 2)
         # Verify embeddings
         self.assertEqual(query_emb, [0.1, 0.2, 0.3])
         self.assertEqual(len(doc_embs), 1)
         self.assertEqual(doc_embs[0], [0.2, 0.3, 0.4])
+    @patch("src.vector_store.genai_client")
+    def test_generate_embeddings_with_timer(self, mock_genai_client):
         """Test embedding generation with timer"""
+        # Mock embeddings
+        mock_embedding = Mock()
+        mock_embedding.values = [0.1, 0.2, 0.3]
+        mock_response = Mock()
+        mock_response.embeddings = [mock_embedding]
+        mock_genai_client.models.embed_content.return_value = mock_response
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         generate_embeddings("Test", self.mock_documents, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("embedding_generation")
+    @patch("src.vector_store.genai_client")
+    def test_generate_embeddings_multiple_docs(self, mock_genai_client):
         """Test embedding generation with multiple documents"""
         # Create multiple mock documents
         mock_doc2 = Mock()
         mock_doc2.page_content = "Second document"
         docs = [self.mock_doc, mock_doc2]
         # Mock embeddings
+        mock_query_emb = Mock()
+        mock_query_emb.values = [0.1, 0.2, 0.3]
+        mock_doc1_emb = Mock()
+        mock_doc1_emb.values = [0.2, 0.3, 0.4]
+        mock_doc2_emb = Mock()
+        mock_doc2_emb.values = [0.3, 0.4, 0.5]
+        # First call for query, second call for both docs
+        call_count = [0]
+        def embed_side_effect(*args, **kwargs):
+            call_count[0] += 1
+            mock_response = Mock()
+            if call_count[0] == 1:
+                mock_response.embeddings = [mock_query_emb]
+            else:
+                mock_response.embeddings = [mock_doc1_emb, mock_doc2_emb]
+            return mock_response
+        mock_genai_client.models.embed_content.side_effect = embed_side_effect
         query_emb, doc_embs = _generate_embeddings_impl("Test", docs)
         # Should have 2 doc embeddings
         self.assertEqual(len(doc_embs), 2)
+        self.assertEqual(mock_genai_client.models.embed_content.call_count, 2)
     def test_calculate_similarity_impl(self):
         """Test internal similarity calculation implementation"""
         query_embedding = [1.0, 0.0, 0.0]
         doc_embeddings = [
             [1.0, 0.0, 0.0],  # Same as query - score should be ~1.0
             [0.0, 1.0, 0.0],  # Orthogonal - score should be ~0.0
+            [0.5, 0.5, 0.0],  # Partial similarity
         ]
         scores = _calculate_similarity_impl(query_embedding, doc_embeddings)
         # Check scores
         self.assertEqual(len(scores), 3)
         self.assertAlmostEqual(scores[0], 1.0, places=5)
         self.assertAlmostEqual(scores[1], 0.0, places=5)
         self.assertGreater(scores[2], 0.0)
         self.assertLess(scores[2], 1.0)
     def test_calculate_similarity_with_timer(self):
         """Test similarity calculation with timer"""
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         query_emb = [1.0, 0.0, 0.0]
         doc_embs = [[1.0, 0.0, 0.0]]
         calculate_similarity(query_emb, doc_embs, timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("similarity_calculation")
     def test_process_context_impl(self):
         """Test internal context processing implementation"""
         # Create mock results with metadata
         for i in range(3):
             mock_result = Mock()
             mock_result.metadata = {
+                "id": f"KB00{i+1}",
+                "question": f"Question {i+1}?",
+                "content": f"Answer {i+1}.",
             }
             results.append(mock_result)
         # Cosine scores (sorted: 0.9, 0.7, 0.5)
         cosine_scores = [0.7, 0.5, 0.9]
         context, source_ids, knowledge_pairs = _process_context_impl(
             results, cosine_scores, max_results=2
         )
         # Should return top 2 results
         self.assertEqual(len(source_ids), 2)
         self.assertEqual(len(knowledge_pairs), 2)
         # Check that highest score (0.9, index 2) is first
+        self.assertEqual(source_ids[0], "KB003")
+        self.assertEqual(knowledge_pairs[0][0], "Question 3?")
         # Check formatted context
         self.assertIn("Knowledge Entry 1:", context)
         self.assertIn("Knowledge Entry 2:", context)
         self.assertIn("Q: Question 3?", context)
         self.assertIn("A: Answer 3.", context)
     def test_process_context_with_timer(self):
         """Test context processing with timer"""
         mock_result = Mock()
+        mock_result.metadata = {"id": "KB001", "question": "Q?", "content": "A."}
         mock_timer = Mock()
         mock_timer.time_step = MagicMock()
         mock_timer.time_step.return_value.__enter__ = Mock()
         mock_timer.time_step.return_value.__exit__ = Mock()
         process_context([mock_result], [0.9], timer=mock_timer)
         # Verify timer was used
         mock_timer.time_step.assert_called_once_with("context_processing")
     def test_process_context_max_results(self):
         """Test that max_results parameter limits output"""
         # Create 5 mock results
         for i in range(5):
             mock_result = Mock()
             mock_result.metadata = {
+                "id": f"KB00{i}",
+                "question": f"Q{i}?",
+                "content": f"A{i}.",
             }
             results.append(mock_result)
         scores = [0.9, 0.8, 0.7, 0.6, 0.5]
         # Request only 3 results
         context, source_ids, knowledge_pairs = _process_context_impl(
             results, scores, max_results=3
         )
         # Should only return 3
         self.assertEqual(len(source_ids), 3)
         self.assertEqual(len(knowledge_pairs), 3)
     def test_process_context_formatting(self):
         """Test context formatting details"""
         mock_result = Mock()
         mock_result.metadata = {
+            "id": "KB001",
+            "question": "Test question?",
+            "content": "Test answer.",
         }
         context, _, _ = _process_context_impl([mock_result], [0.9], max_results=1)
         # Check formatting
         self.assertIn("Knowledge Entry 1:", context)
         self.assertIn("Q: Test question?", context)
         self.assertIn("A: Test answer.", context)
         self.assertIn("-" * 40, context)
     def test_process_context_missing_metadata(self):
         """Test context processing with missing metadata fields"""
         mock_result = Mock()
         mock_result.metadata = {}  # No metadata
         context, source_ids, knowledge_pairs = _process_context_impl(
             [mock_result], [0.9], max_results=1
         )
         # Should handle missing fields with N/A
         self.assertIn("N/A", context)
         self.assertEqual(source_ids[0], "N/A")
+    @patch("src.vector_store.get_knowledge_base_data")
+    @patch("src.vector_store.chromadb.PersistentClient")
+    @patch("src.vector_store.Chroma")
+    def test_initialize_vector_store_new_collection(
+        self, mock_chroma_class, mock_client_class, mock_get_kb
+    ):
+        """Test initializing vector store with new collection"""
+        # Mock knowledge base data
+        mock_get_kb.return_value = (
+            ["doc1", "doc2"],
+            [{"id": "1"}, {"id": "2"}],
+            ["id1", "id2"],
+        )
+        # Mock ChromaDB client
+        mock_client = Mock()
+        mock_client_class.return_value = mock_client
+        # Simulate collection doesn't exist (raises exception)
+        mock_client.get_collection.side_effect = Exception("Collection not found")
+        # Mock create_collection
+        mock_collection = Mock()
+        mock_client.create_collection.return_value = mock_collection
+        # Mock Chroma vector store
+        mock_vector_store = Mock()
+        mock_retriever = Mock()
+        mock_vector_store.as_retriever.return_value = mock_retriever
+        mock_chroma_class.return_value = mock_vector_store
+        # Call function
+        from src.vector_store import initialize_vector_store
+        collection, vector_store, retriever = initialize_vector_store()
+        # Verify collection was created
+        mock_client.create_collection.assert_called_once()
+        mock_collection.add.assert_called_once()
+        # Verify vector store and retriever
+        self.assertEqual(vector_store, mock_vector_store)
+        self.assertEqual(retriever, mock_retriever)
+    @patch("src.vector_store.get_knowledge_base_data")
+    @patch("src.vector_store.chromadb.PersistentClient")
+    @patch("src.vector_store.Chroma")
+    def test_initialize_vector_store_existing_collection(
+        self, mock_chroma_class, mock_client_class, mock_get_kb
+    ):
+        """Test initializing vector store with existing collection"""
+        # Mock knowledge base data
+        mock_get_kb.return_value = (
+            ["doc1", "doc2"],
+            [{"id": "1"}, {"id": "2"}],
+            ["id1", "id2"],
+        )
+        # Mock ChromaDB client
+        mock_client = Mock()
+        mock_client_class.return_value = mock_client
+        # Simulate collection exists
+        mock_collection = Mock()
+        mock_client.get_collection.return_value = mock_collection
+        # Mock Chroma vector store
+        mock_vector_store = Mock()
+        mock_retriever = Mock()
+        mock_vector_store.as_retriever.return_value = mock_retriever
+        mock_chroma_class.return_value = mock_vector_store
+        # Call function
+        from src.vector_store import initialize_vector_store
+        collection, vector_store, retriever = initialize_vector_store()
+        # Verify existing collection was loaded (not created)
+        mock_client.get_collection.assert_called_once()
+        mock_client.create_collection.assert_not_called()
+        # Verify vector store and retriever
+        self.assertEqual(collection, mock_collection)
+        self.assertEqual(vector_store, mock_vector_store)
+        self.assertEqual(retriever, mock_retriever)
+    @patch("src.vector_store.get_knowledge_base_data")
+    @patch("src.vector_store.chromadb.PersistentClient")
+    def test_initialize_vector_store_failure(self, mock_client_class, mock_get_kb):
+        """Test initialize_vector_store handles errors properly"""
+        # Mock knowledge base data
+        mock_get_kb.return_value = (["doc1"], [{"id": "1"}], ["id1"])
+        # Mock client to raise exception
+        mock_client_class.side_effect = Exception("Database connection failed")
+        # Call function and expect exception
+        from src.vector_store import initialize_vector_store
+        with self.assertRaises(Exception) as context:
+            initialize_vector_store()
+        self.assertIn("Database connection failed", str(context.exception))
+if __name__ == "__main__":
     unittest.main()

tox.ini ADDED Viewed

	@@ -0,0 +1,25 @@

+[tox]
+envlist = py310,py311,format,lint
+skipsdist = True
+[testenv]
+deps = -r requirements.txt
+commands = pytest {posargs}
+[testenv:format]
+deps =
+    black
+    isort
+    autoflake
+commands =
+    autoflake --remove-all-unused-imports --remove-unused-variables --in-place --recursive src tests app.py
+    black src tests app.py
+    isort src tests app.py
+[testenv:lint]
+deps =
+    flake8
+    pylint
+commands =
+    flake8 src tests
+    pylint src tests