Spaces:

jackenmail
/

rag-embedder

Runtime error

App Files Files Community

rag-embedder / app /rag_app.py

jackenmail

Upload 3 files

41ac698 verified 23 days ago

raw

history blame contribute delete

4.6 kB

	# ─────────────────────────────────────────────────────────────
	# app/rag_app.py
	# Main RAG application — runs locally, calls HF for everything
	# ─────────────────────────────────────────────────────────────

	import os
	import sys

	# Load .env file
	from dotenv import load_dotenv
	load_dotenv()

	# Add project root to path
	sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

	from utils.embedder import HFEmbedder
	from utils.retriever import FAISSRetriever
	from utils.generator import HFGenerator


	# ── Config ────────────────────────────────────────────────────
	DOCS_PATH = os.getenv("DOCS_PATH", "data/sample_docs.txt")
	FAISS_INDEX_PATH = os.getenv("FAISS_INDEX_PATH", "vector_store/index.faiss")
	TOP_K = 3


	# ── Load documents ────────────────────────────────────────────
	def load_documents(path: str) -> list:
	if not os.path.exists(path):
	raise FileNotFoundError(f"No documents found at {path}")
	with open(path) as f:
	docs = [line.strip() for line in f if line.strip()]
	print(f"Loaded {len(docs)} documents from {path}")
	return docs


	# ── Build or load index ───────────────────────────────────────
	def setup_retriever(embedder: HFEmbedder, force_rebuild: bool = False) -> FAISSRetriever:
	retriever = FAISSRetriever(FAISS_INDEX_PATH)

	if os.path.exists(FAISS_INDEX_PATH) and not force_rebuild:
	print("Loading existing FAISS index...")
	retriever.load()
	else:
	print("Building new FAISS index...")
	docs = load_documents(DOCS_PATH)
	embeddings = embedder.embed_batch(docs)
	retriever.build(docs, embeddings)
	retriever.save()

	return retriever


	# ── Main RAG function ─────────────────────────────────────────
	class RAGPipeline:
	def __init__(self, force_rebuild: bool = False):
	print("\n" + "=" * 55)
	print(" RAG Pipeline — Your Own HF Model")
	print("=" * 55)

	# Initialize components
	self.embedder = HFEmbedder()
	self.retriever = setup_retriever(self.embedder, force_rebuild)
	self.generator = HFGenerator()
	print("\nAll components ready!\n")

	def ask(self, question: str, verbose: bool = True) -> dict:
	"""Ask a question and get an answer grounded in your documents."""

	if verbose:
	print(f"Question : {question}")

	# Step 1: Embed query
	query_vec = self.embedder.embed(question)

	# Step 2: Retrieve relevant chunks
	chunks = self.retriever.search(query_vec, top_k=TOP_K)

	if verbose:
	print(f"Retrieved : {[c['text'][:60] for c in chunks]}")

	# Step 3: Generate answer
	answer = self.generator.generate(question, chunks)

	if verbose:
	print(f"Answer : {answer}\n")

	return {
	"question": question,
	"answer" : answer,
	"sources" : [c["text"] for c in chunks]
	}


	# ── Run interactively ─────────────────────────────────────────
	if __name__ == "__main__":
	rag = RAGPipeline()

	# Demo questions
	demo_questions = [
	"What is the refund policy?",
	"How do I reset my password?",
	"When can I contact support?",
	"How long can I return a product?"
	]

	print("=" * 55)
	print(" Demo Questions")
	print("=" * 55)

	for q in demo_questions:
	result = rag.ask(q)
	print(f"Q: {result['question']}")
	print(f"A: {result['answer']}")
	print("-" * 55)

	# Interactive mode
	print("\nInteractive mode — type your question (or 'quit' to exit)")
	while True:
	user_input = input("\nYou: ").strip()
	if user_input.lower() in ["quit", "exit", "q"]:
	print("Goodbye!")
	break
	if user_input:
	result = rag.ask(user_input)
	print(f"Bot: {result['answer']}")