Spaces:

anpigon
/

obsidian-qa-bot

Sleeping

App Files Files Community

obsidian-qa-bot / app.py

anpigon

Refactored the app.py file to improve structure and readability.

7935c3a over 1 year ago

raw

history blame contribute delete

4.52 kB

	import os
	import gradio as gr
	import platform
	from langchain_community.document_loaders import ObsidianLoader
	from langchain_text_splitters import RecursiveCharacterTextSplitter, Language
	from langchain.embeddings import CacheBackedEmbeddings
	from langchain.storage import LocalFileStore
	from langchain_community.embeddings import HuggingFaceBgeEmbeddings
	from langchain_community.vectorstores import FAISS
	from langchain_community.retrievers import BM25Retriever
	from langchain.retrievers import EnsembleRetriever
	from langchain_cohere import CohereRerank
	from langchain.retrievers.contextual_compression import ContextualCompressionRetriever
	from langchain_core.runnables import ConfigurableField, RunnablePassthrough
	from langchain_core.output_parsers import StrOutputParser
	from langchain_groq import ChatGroq
	from langchain_google_genai import GoogleGenerativeAI

	from prompt_template import PROMPT_TEMPLATE

	DIRECTORIES = ["./docs/obsidian-help", "./docs/obsidian-developer"]
	FAISS_DB_INDEX = "db_index"

	def load_and_process_documents(directories):
	md_docs = []
	for directory in directories:
	try:
	loader = ObsidianLoader(directory, encoding="utf-8")
	md_docs.extend(loader.load())
	except Exception:
	pass

	md_splitter = RecursiveCharacterTextSplitter.from_language(
	language=Language.MARKDOWN,
	chunk_size=2000,
	chunk_overlap=200,
	)
	return md_splitter.split_documents(md_docs)

	def setup_retrieval_system(splitted_docs):
	if platform.system() == "Darwin":
	model_kwargs = {"device": "mps"}
	else:
	model_kwargs = {"device": "cpu"}

	embeddings = HuggingFaceBgeEmbeddings(
	model_name="BAAI/bge-m3",
	model_kwargs=model_kwargs,
	encode_kwargs={"normalize_embeddings": True},
	)

	store = LocalFileStore("./.cache/")
	cached_embeddings = CacheBackedEmbeddings.from_bytes_store(
	embeddings,
	store,
	namespace=embeddings.model_name,
	)

	if os.path.exists(FAISS_DB_INDEX):
	db = FAISS.load_local(
	FAISS_DB_INDEX,
	cached_embeddings,
	allow_dangerous_deserialization=True,
	)
	else:
	db = FAISS.from_documents(splitted_docs, cached_embeddings)
	db.save_local(folder_path=FAISS_DB_INDEX)

	faiss_retriever = db.as_retriever(search_type="mmr", search_kwargs={"k": 10})
	bm25_retriever = BM25Retriever.from_documents(splitted_docs)
	bm25_retriever.k = 10

	ensemble_retriever = EnsembleRetriever(
	retrievers=[bm25_retriever, faiss_retriever],
	weights=[0.5, 0.5],
	search_type="mmr",
	)

	compressor = CohereRerank(model="rerank-multilingual-v3.0", top_n=5)
	return ContextualCompressionRetriever(
	base_compressor=compressor,
	base_retriever=ensemble_retriever,
	)

	def setup_language_model():
	return ChatGroq(
	model_name="llama3-70b-8192",
	temperature=0,
	).configurable_alternatives(
	ConfigurableField(id="llm"),
	default_key="llama3",
	gemini=GoogleGenerativeAI(
	model="gemini-pro",
	temperature=0,
	),
	)

	def format_docs(docs):
	formatted_docs = []
	for doc in docs:
	formatted_doc = f"Page Content:\n{doc.page_content}\n"
	if doc.metadata.get("source"):
	formatted_doc += f"Source: {doc.metadata['source']}\n"
	formatted_docs.append(formatted_doc)
	return "\n---\n".join(formatted_docs)

	def main():
	splitted_docs = load_and_process_documents(DIRECTORIES)
	compression_retriever = setup_retrieval_system(splitted_docs)
	llm = setup_language_model()

	rag_chain = (
	{"context": compression_retriever \| format_docs, "question": RunnablePassthrough()}
	\| PROMPT_TEMPLATE
	\| llm
	\| StrOutputParser()
	)

	def predict(message, history=None):
	return rag_chain.invoke(message)

	gr.ChatInterface(
	predict,
	title="옵시디언 노트앱 및 플러그인 개발에 대해서 물어보세요!",
	description="안녕하세요!\n저는 옵시디언 노트앱과 플러그인 개발에 대한 인공지능 QA봇입니다. 옵시디언 노트앱의 사용법, 고급 기능, 플러그인 및 테마 개발에 대해 깊은 지식을 가지고 있어요. 문서 작업, 정보 정리 또는 개발에 관한 도움이 필요하시면 언제든지 질문해주세요!",
	).launch()

	if __name__ == "__main__":
	main()