Spaces:

Dheeraj-13
/

RAG_Knowledge_Assistant

Sleeping

App Files Files Community

RAG_Knowledge_Assistant / apps /web /app.py

Dheeraj-13

Feature: Additive Ingestion - Allow adding new docs without wiping old ones. Added Clear button.

d3a38ee about 1 month ago

raw

history blame contribute delete

8.2 kB

	import sys
	import os
	from dotenv import load_dotenv

	load_dotenv()
	# Force rebuild trigger

	# Add root to sys.path
	sys.path.append(os.path.abspath(os.path.join(os.path.dirname(__file__), "../..")))

	import gradio as gr
	import shutil
	import spaces
	from services.rag.retrieve import get_retriever
	from services.rag.rerank import get_reranker
	from services.rag.generate import get_generator, run_local_generation
	from services.rag.ingest import ingest
	from services.rag.index import build_index
	from services.observability.langfuse_client import observe
	# Constants
	DATA_DIR = "data"
	PROCESSED_DIR = os.path.join(DATA_DIR, "processed")
	INDEX_DIR = os.path.join(DATA_DIR, "index")
	SAMPLES_DIR = "samples"

	# Global Singletons
	retriever = None
	reranker = None
	generator = None

	def init_services():
	global retriever, reranker, generator
	try:
	if os.path.exists(INDEX_DIR):
	retriever = get_retriever(INDEX_DIR)
	reranker = get_reranker()
	generator = get_generator()
	except Exception as e:
	print(f"Service init warning: {e}")

	# GPU-wrapped generation function
	@spaces.GPU
	def generate_response_gpu(message, context_chunks, backend):
	# Call the standalone function directly
	# Note: We must pass data, not the service instance
	return run_local_generation(message, context_chunks)

	@observe(name="chat_interaction")
	def chat_fn(message, history, backend):
	global retriever, reranker, generator

	if retriever is None:
	# Try to reload if index was just built
	init_services()
	if retriever is None:
	return "System is not ready. Please go to '1. Knowledge Base' tab and ingest documents."

	# 0. Contextualize Query (Simple)
	full_query = message

	import time
	start_time = time.time()

	# 1. Retrieve
	retrieved = retriever.retrieve(full_query, top_k=10)
	if not retrieved:
	return "No relevant documents found in index."

	# 2. Rerank
	reranked = reranker.rerank(full_query, retrieved, top_k=5)

	# 3. Generate
	if backend == "local":
	answer = generate_response_gpu(full_query, reranked, backend)
	else:
	answer = generator.generate(full_query, reranked, backend=backend)

	# 4. Format Output with Evidence
	elapsed = time.time() - start_time

	# Build Sources Text
	sources_text = "\n\n### Evidence\n"
	for i, chunk in enumerate(reranked):
	meta = chunk.get('metadata', {})
	score = chunk.get('rerank_score', chunk.get('score', 0))
	sources_text += f"[{i+1}] {meta.get('doc_id')} (Score: {score:.2f})\n"
	snippet = chunk['content'][:150].replace('\n', ' ')
	sources_text += f"> ...{snippet}...\n\n"

	final_response = f"{answer}\n\n{sources_text}\n(Backend: {backend} \| Time: {elapsed:.2f}s)"
	return final_response



	def clear_knowledge_base():
	# Helper to wipe data
	for d in [PROCESSED_DIR, INDEX_DIR]:
	if os.path.exists(d):
	shutil.rmtree(d)
	os.makedirs(d)

	# Reset helper
	import services.rag.retrieve
	services.rag.retrieve._shared_retriever = None
	init_services()

	return "Knowledge Base Cleared. System is empty."

	def admin_ingest(files, use_sample):
	# 1. Clean Temp Input ONLY (Keep Processed/Index for additive)
	temp_in = "temp_ingest"
	if os.path.exists(temp_in):
	shutil.rmtree(temp_in)
	os.makedirs(temp_in)

	# Ensure processed/index dirs exist
	os.makedirs(PROCESSED_DIR, exist_ok=True)
	os.makedirs(INDEX_DIR, exist_ok=True)

	status = "Starting processing...\n"

	# Handle Source Selection
	files_found = False

	if use_sample:
	# Copy from samples dir
	sample_file = os.path.join(SAMPLES_DIR, "sports_legends.txt")
	if os.path.exists(sample_file):
	shutil.copy(sample_file, temp_in)
	status += f"Loaded: Sports Legends Dataset\n"
	files_found = True
	else:
	return "Error: Sample data not found on server."

	if files:
	# Copy uploaded files
	for file in files:
	shutil.copy(file.name, temp_in)
	status += f"Loaded: {len(files)} new files.\n"
	files_found = True

	if not files_found:
	return "No new files selected. Select files or sample data."

	yield status

	# Run Ingest
	try:
	# Ingest new files to PROCESSED_DIR (Additive)
	ingest(temp_in, PROCESSED_DIR)
	status += "Processing new files complete.\nRebuilding Index...\n"
	yield status

	# Build Index (scans ALL files in PROCESSED_DIR)
	build_index(PROCESSED_DIR, INDEX_DIR)
	status += "Index rebuilt with all documents.\nReloading services...\n"
	yield status

	# FORCE RELOAD: Clear singletons
	import services.rag.retrieve
	services.rag.retrieve._shared_retriever = None

	init_services()
	status += "Services reloaded. Knowledge Base Updated successfully!"
	except Exception as e:
	print(f"Ingestion Failed: {e}") # Print to server logs
	import traceback
	traceback.print_exc()
	status += f"Error: {e}"

	return status

	# Initialize on module load
	init_services()

	with gr.Blocks(title="RAG Knowledge Assistant", theme=gr.themes.Soft()) as demo:
	gr.Markdown("# RAG Knowledge Assistant")

	with gr.Row():

	# Left Column: Sidebar (Controls & Guide)
	with gr.Column(scale=1, variant="panel"):
	with gr.Group():
	file_upload = gr.File(
	label="Document Upload",
	file_count="multiple",
	file_types=[".pdf", ".txt", ".html"],
	height=70
	)

	gr.HTML("<div style='text-align: center; color: #666; font-size: 11px; margin: 2px 0;'>— OR —</div>")

	use_sample_chk = gr.Checkbox(
	label="Use Sports Legends Sample Dataset",
	container=False
	)

	ingest_btn = gr.Button("Process Documents", variant="primary", size="sm")
	clear_btn = gr.Button("Clear Knowledge Base", variant="stop", size="sm")

	# Status Log - Visible by default
	with gr.Accordion("System Logs", open=True):
	status_box = gr.Textbox(
	show_label=False,
	value="System Ready.",
	interactive=False,
	lines=4,
	max_lines=10,
	text_align="left"
	)

	ingest_btn.click(
	admin_ingest,
	inputs=[file_upload, use_sample_chk],
	outputs=[status_box]
	)

	clear_btn.click(
	clear_knowledge_base,
	outputs=[status_box]
	)

	with gr.Group():
	backend_radio = gr.Radio(
	choices=["openai", "gemini", "local"],
	value="openai",
	label="LLM Backend",
	container=False
	)
	gr.HTML("<div style='font-size: 9px; color: #888; margin-top: 2px;'>*Local = Mistral-7B (ZeroGPU)</div>")

	# Right Column: Main App (Chat)
	with gr.Column(scale=4):
	chatbot = gr.ChatInterface(
	fn=chat_fn,
	additional_inputs=[backend_radio],
	title="Chat Interface",
	description="Ask questions about your uploaded documents or the sample dataset.",
	examples=[
	["Who is the greatest quarterback?", "openai"],
	["Summarize the uploaded documents", "local"],
	["What makes Lionel Messi a legend?", "gemini"]
	]
	)

	if __name__ == "__main__":
	# specific server_name needed for Docker/Spaces
	demo.queue().launch(server_name="0.0.0.0")