Spaces:

Amitkarar
/

Chatboat_With_PDF

Sleeping

App Files Files Community

Chatboat_With_PDF / app.py

Amitkarar

Refactor app.py for improved readability and structure

29b9253 unverified 20 days ago

raw

history blame contribute delete

3.59 kB

	import os
	import streamlit as st
	from dotenv import load_dotenv

	# LangChain + Hugging Face + Groq
	from langchain_chroma import Chroma
	from langchain_community.chat_message_histories import ChatMessageHistory
	from langchain_core.chat_history import BaseChatMessageHistory
	from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
	from langchain_text_splitters import RecursiveCharacterTextSplitter
	from langchain_community.document_loaders import PyPDFLoader
	from langchain_groq import ChatGroq
	from langchain_huggingface import HuggingFaceEmbeddings

	# Load environment variables
	load_dotenv()

	# Hugging Face token
	#HUGGINGFACEHUB_API_TOKEN = st.secrets["HF_TOKEN"]
	#st.secrets["HF_TOKEN"]

	# Streamlit UI
	st.title("Conversational RAG with PDF Uploads")
	st.write("Upload PDFs and chat with their content using Hugging Face embeddings + Groq LLM")

	# Groq API key input
	api_key = st.text_input("Enter your Groq API key:", type="password")

	if api_key:
	# Initialize Groq LLM (use supported model)
	llm = ChatGroq(groq_api_key=api_key, model_name="llama-3.3-70b-versatile")

	# Session management
	session_id = st.text_input("Session ID", value="default_session")
	if "store" not in st.session_state:
	st.session_state.store = {}

	# File uploader
	uploaded_files = st.file_uploader("Choose PDF files", type="pdf", accept_multiple_files=True)

	if uploaded_files:
	documents = []
	for uploaded_file in uploaded_files:
	temppdf = "./temp.pdf"
	with open(temppdf, "wb") as file:
	file.write(uploaded_file.getvalue())
	loader = PyPDFLoader(temppdf)
	docs = loader.load()
	documents.extend(docs)

	# Split and embed
	text_splitter = RecursiveCharacterTextSplitter(chunk_size=2000, chunk_overlap=200)
	splits = text_splitter.split_documents(documents)

	embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L12-v2")
	vectorstore = Chroma.from_documents(documents=splits, embedding=embeddings)
	retriever = vectorstore.as_retriever()

	# Prompt template
	qa_prompt = ChatPromptTemplate.from_messages([
	("system", "Use retrieved context to answer concisely:\n\n{context}"),
	MessagesPlaceholder("chat_history"),
	("human", "{input}"),
	])

	def rag_chain(question, chat_history):
	retrieved_docs = retriever.invoke(question)
	context = "\n".join([doc.page_content for doc in retrieved_docs])
	prompt = qa_prompt.format(chat_history=chat_history, input=question, context=context)
	return llm.invoke(prompt)

	def get_session_history(session: str) -> BaseChatMessageHistory:
	if session not in st.session_state.store:
	st.session_state.store[session] = ChatMessageHistory()
	return st.session_state.store[session]

	# User input
	user_input = st.text_input("Your question:")
	if user_input:
	session_history = get_session_history(session_id)
	response = rag_chain(user_input, session_history.messages)
	session_history.add_user_message(user_input)
	session_history.add_ai_message(response.content)

	st.write("Assistant:", response.content)
	st.write("Chat History:", session_history.messages)

	else:
	st.warning("Please enter your Groq API Key")