Spaces:

logan-codes
/

Knowledge_Mangaement_System_using_RAG

Running

App Files Files Community

Knowledge_Mangaement_System_using_RAG / app /services /retriever.py

logan-codes

changed the data dir to hf compatible

ea1e7dc about 2 months ago

raw

history blame contribute delete

3.22 kB

	from langchain_chroma.vectorstores import Chroma
	from langchain_huggingface.embeddings import HuggingFaceEmbeddings
	from langchain_google_genai import ChatGoogleGenerativeAI
	from langchain_core.prompts import ChatPromptTemplate
	from langchain_core.output_parsers import StrOutputParser
	from dotenv import load_dotenv
	import os

	class Retriever:
	def __init__(self, embedding_model:HuggingFaceEmbeddings=None):
	self.embed= embedding_model if embedding_model else HuggingFaceEmbeddings(
	model_name="sentence-transformers/all-MiniLM-L6-v2"
	)
	load_dotenv()
	base_dir = os.getenv("HF_HOME", "/home/user/app")
	self.DATA_DIR = os.path.join(base_dir, "data")
	self.vector_store=Chroma(
	collection_name="documents_collection",
	embedding_function=self.embed,
	persist_directory=os.path.join(self.DATA_DIR,"chroma_db")
	)

	self.GEMINI_API_KEY = os.getenv("GOOGLE_API_KEY")
	if self.GEMINI_API_KEY is None:
	raise ValueError("GOOGLE_API_KEY not found in environment variables.")

	def _retrieve_chunks(self,query:str):
	retrieved_chunks = self.vector_store.similarity_search(query,k=3)
	return retrieved_chunks

	def _query_transformer(self,query:str):
	template= """You are an AI language model assistant. Your task is to generate three
	different versions of the given user question to retrieve relevant documents from a vector
	database. By generating multiple perspectives on the user question, your goal is to help
	the user overcome some of the limitations of the distance-based similarity search.
	Provide these alternative questions separated by newlines. Original question: {question}"""
	prompt = ChatPromptTemplate.from_template(template)
	llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash-lite",temperature=0.7)
	chain= (prompt
	\| llm
	\| StrOutputParser()
	\| (lambda x: x.strip().split("\n")) # Split the output into a list of questions
	)
	response= chain.invoke({"question": query})
	return response

	def retrieve_context(self, query: str):
	transformed_queries = self._query_transformer(query)
	all_retrieved_chunks = []
	for tq in transformed_queries:
	chunks = self._retrieve_chunks(tq)
	for chunk in chunks:
	if chunk not in all_retrieved_chunks:
	all_retrieved_chunks.append(chunk)

	context=""
	for idx, doc in enumerate(all_retrieved_chunks):
	context+=(f"Context {idx+1}:\n{doc.page_content}\n{'-'*50}\n")
	return context

	if __name__ == "__main__":
	retriever_instance = Retriever()
	# results = retriever_instance.retrieve_chunks("Sample query")
	# print(results)
	# transformed_response = retriever_instance.query_transformer("tell me about the history of AI and its applications in healthcare and finance")
	# print(transformed_response)
	context = retriever_instance.retrieve_context("how does the ocr work in docling?")
	print(context)