AsyncRAG

Sleeping

Zubaish commited on 23 days ago

Commit

2d4b429

1 Parent(s): b713a11

Fix Docker build: create kb_docs at runtime

Files changed (4) hide show

Dockerfile CHANGED Viewed

@@ -1,22 +1,23 @@
 FROM python:3.10-slim
-# Set working directory
 WORKDIR /app
-# Install system dependencies
 RUN apt-get update && apt-get install -y \
     git \
     && rm -rf /var/lib/apt/lists/*
-# Install Python dependencies
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
-# Copy application code
 COPY app.py rag.py ingest.py guardrails.py config.py ./
-COPY kb_docs ./kb_docs
-# Hugging Face Spaces expects port 7860
 EXPOSE 7860
 # Start FastAPI

 FROM python:3.10-slim
 WORKDIR /app
+# System dependencies
 RUN apt-get update && apt-get install -y \
     git \
     && rm -rf /var/lib/apt/lists/*
+# Python dependencies
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
+# Application code
 COPY app.py rag.py ingest.py guardrails.py config.py ./
+# Create empty kb_docs directory (PDFs added later via HF UI)
+RUN mkdir -p kb_docs
+# Hugging Face Spaces port
 EXPOSE 7860
 # Start FastAPI

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 from fastapi import FastAPI
 from pydantic import BaseModel
 from rag import ask_rag_with_status
 app = FastAPI(title="HubRAG API")
@@ -10,10 +9,7 @@ class Question(BaseModel):
 @app.get("/")
 def root():
-    return {
-        "status": "ok",
-        "message": "RAG API is running"
-    }
 @app.post("/chat")
 def chat(req: Question):

 from fastapi import FastAPI
 from pydantic import BaseModel
 from rag import ask_rag_with_status
 app = FastAPI(title="HubRAG API")
 @app.get("/")
 def root():
+    return {"status": "ok", "message": "RAG API running"}
 @app.post("/chat")
 def chat(req: Question):

ingest.py CHANGED Viewed

@@ -1,7 +1,11 @@
 from langchain_community.document_loaders import DirectoryLoader, PyPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 def load_and_split_docs(path="kb_docs"):
     loader = DirectoryLoader(
         path,
         glob="**/*.pdf",
@@ -9,9 +13,11 @@ def load_and_split_docs(path="kb_docs"):
     )
     docs = loader.load()
     splitter = RecursiveCharacterTextSplitter(
         chunk_size=800,
         chunk_overlap=100
     )
     return splitter.split_documents(docs)

 from langchain_community.document_loaders import DirectoryLoader, PyPDFLoader
 from langchain_text_splitters import RecursiveCharacterTextSplitter
+import os
 def load_and_split_docs(path="kb_docs"):
+    if not os.path.exists(path):
+        return []
     loader = DirectoryLoader(
         path,
         glob="**/*.pdf",
     )
     docs = loader.load()
+    if not docs:
+        return []
     splitter = RecursiveCharacterTextSplitter(
         chunk_size=800,
         chunk_overlap=100
     )
     return splitter.split_documents(docs)

rag.py CHANGED Viewed

@@ -4,46 +4,48 @@ from langchain.schema import SystemMessage, HumanMessage
 from ingest import load_and_split_docs
-print("⏳ Indexing documents...")
-embeddings = HuggingFaceEmbeddings(
-    model_name="sentence-transformers/all-MiniLM-L6-v2"
-)
 documents = load_and_split_docs()
-vectorstore = Chroma.from_documents(
-    documents,
-    embedding=embeddings
 )
-retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
 llm = ChatHuggingFace(
     repo_id="microsoft/Phi-4-mini-instruct",
     temperature=0.2
 )
-print("✅ Indexing complete.")
 def ask_rag_with_status(question: str):
-    status = [
-        "🔍 Retrieving relevant documents...",
-        "🧠 Building context...",
-        "💭 Thinking..."
-    ]
     docs = retriever.get_relevant_documents(question)
     context = "\n\n".join(d.page_content for d in docs)
     messages = [
-        SystemMessage(content="You are a helpful assistant. Answer using the context."),
         HumanMessage(content=f"Context:\n{context}\n\nQuestion: {question}")
     ]
     response = llm.invoke(messages)
     return {
-        "status": status,
         "answer": response.content
     }

 from ingest import load_and_split_docs
+print("⏳ Loading documents...")
 documents = load_and_split_docs()
+embeddings = HuggingFaceEmbeddings(
+    model_name="sentence-transformers/all-MiniLM-L6-v2"
 )
+if documents:
+    vectorstore = Chroma.from_documents(
+        documents,
+        embedding=embeddings
+    )
+    retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
+else:
+    retriever = None
 llm = ChatHuggingFace(
     repo_id="microsoft/Phi-4-mini-instruct",
     temperature=0.2
 )
+print("✅ RAG initialized.")
 def ask_rag_with_status(question: str):
+    if not retriever:
+        return {
+            "status": ["⚠️ No documents uploaded yet"],
+            "answer": "Please upload PDF files to the kb_docs folder."
+        }
     docs = retriever.get_relevant_documents(question)
     context = "\n\n".join(d.page_content for d in docs)
     messages = [
+        SystemMessage(content="Answer using the provided context."),
         HumanMessage(content=f"Context:\n{context}\n\nQuestion: {question}")
     ]
     response = llm.invoke(messages)
     return {
+        "status": ["🔍 Retrieved documents", "🧠 Generating answer"],
         "answer": response.content
     }