Spaces:

sid22669
/

AI_Assistant

Sleeping

App Files Files Community

sid22669 commited on May 23, 2025

Commit

f026756

verified ·

1 Parent(s): ae6a72f

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -43

app.py CHANGED Viewed

@@ -4,80 +4,75 @@ from langchain.vectorstores import Chroma
 from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
 from langchain.memory import ConversationBufferMemory
 from langchain.chains import ConversationalRetrievalChain
 from langchain_openai import ChatOpenAI
 from langchain.chains.combine_documents import create_stuff_documents_chain
 from langchain.embeddings import HuggingFaceEmbeddings
-embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
-persist_directory = 'vec_db'
-vectordb = Chroma(persist_directory=persist_directory,
-                  embedding_function=embedding_model)
-vectordb_retriever = vectordb.as_retriever(search_kwargs={'k':5})
-llm = ChatOpenAI(model="gpt-4.1-nano", temperature=0.7)
-with open("instructions.txt", 'r') as file:
     instructions = file.read()
 custom_prompt = ChatPromptTemplate.from_messages([
     ("system", instructions),
     MessagesPlaceholder(variable_name="chat_history"),
     ("user", "Question: {input}\nContext: {context}")
 ])
-question_answer_chain = create_stuff_documents_chain(llm, custom_prompt)
-chain = create_retrieval_chain(vectordb_retriever, question_answer_chain)
-greetings = {"hey", "hi", "hello"}
-def conversate_assistant(query, history, memory):
-    # Load limited chat history from memory
-    history_data = memory.load_memory_variables({})["chat_history"]
-    chat_history = history_data[-6:] if len(history_data) >= 6 else history_data
     normalized_query = query.strip().lower()
     if normalized_query in greetings:
-        response = question_answer_chain({
             "input": query,
-            "context": [],
             "chat_history": chat_history
         })
-        answer = response.get("output") or str(response)
     else:
-        response = chain({
             "input": query,
             "chat_history": chat_history
         })
-        answer = response.get('answer') or str(response)
-    # Save context in this session's memory
     memory.save_context({"input": query}, {"output": answer})
-    return answer, history + [(query, answer)], memory
-# Gradio interface with state for memory and chat history
-with gr.Blocks() as demo:
-    chatbot = gr.Chatbot()
-    msg = gr.Textbox()
-    state = gr.State([])   # to keep chat history visible in UI
-    memory_state = gr.State(None)  # to keep ConversationBufferMemory per session
-    def init_memory():
-        return ConversationBufferMemory(
-            memory_key="chat_history",
-            return_messages=True
-        )
-    def respond(user_message, chat_history, memory):
-        if memory is None:
-            memory = init_memory()
-        answer, chat_history, memory = conversate_assistant(user_message, chat_history, memory)
-        return chat_history, memory, ""
-    msg.submit(respond, inputs=[msg, state, memory_state], outputs=[chatbot, memory_state, msg])
-demo.launch()

 from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
 from langchain.memory import ConversationBufferMemory
 from langchain.chains import ConversationalRetrievalChain
+from langchain.memory.chat_message_histories import ChatMessageHistory
 from langchain_openai import ChatOpenAI
 from langchain.chains.combine_documents import create_stuff_documents_chain
 from langchain.embeddings import HuggingFaceEmbeddings
+ embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+ persist_directory = 'vec_db'
+ vectordb = Chroma(persist_directory=persist_directory,
+                           embedding_function=embedding_model)
+ vectordb_retriever = vectordb.as_retriever(search_kwargs={'k':5})
+ llm = ChatOpenAI(model="gpt-4.1-nano", temperature=0.7)
+ with open("instructions.txt", 'r') as file:
     instructions = file.read()
+ # Custom prompt
 custom_prompt = ChatPromptTemplate.from_messages([
     ("system", instructions),
     MessagesPlaceholder(variable_name="chat_history"),
     ("user", "Question: {input}\nContext: {context}")
 ])
+ # Memory
+memory = ConversationBufferMemory(
+    memory_key="chat_history",
+    return_messages=True
+)
+ question_answer_chain = create_stuff_documents_chain(llm, custom_prompt)
+ chain = create_retrieval_chain(vectordb_retriever, question_answer_chain)
+ def conversate_assistant(query, history):
+    greetings = {"hey", "hi", "hello"}
     normalized_query = query.strip().lower()
+     if len(memory.load_memory_variables({})["chat_history"]) >=6:
+        chat_history = memory.load_memory_variables({})["chat_history"][-6::]
+    else:
+        chat_history = memory.load_memory_variables({})["chat_history"]
+     # If greeting, skip retrieval and context
     if normalized_query in greetings:
+        response = question_answer_chain.invoke({
             "input": query,
+            "context": [],  # empty context for greetings
             "chat_history": chat_history
         })
+        answer = response
     else:
+        response = chain.invoke({
             "input": query,
             "chat_history": chat_history
         })
+        answer = response['answer']
+    # Save to memory
     memory.save_context({"input": query}, {"output": answer})
+     return answer
+ demo = gr.ChatInterface(
+    conversate_assistant,
+    type="messages"
+)
+ demo.launch()