Spaces:

amanm10000
/

MLSC-Coherence-25-FAQ-Chatbot-API

Sleeping

App Files Files Community

MLSC-Coherence-25-FAQ-Chatbot-API / main.py

amanm10000

abcd

3cf6d01 about 1 year ago

raw

history blame

4.02 kB

	import os
	import getpass
	from groq import Groq
	from langchain.chat_models import init_chat_model
	from langchain_core.messages import HumanMessage, SystemMessage
	from langchain_core.vectorstores import InMemoryVectorStore
	from langchain_core.documents import Document
	from langchain_text_splitters import RecursiveCharacterTextSplitter
	from langchain_community.document_loaders import UnstructuredMarkdownLoader
	from langchain_community.embeddings import HuggingFaceInferenceAPIEmbeddings
	from langchain import hub
	from langgraph.graph import START, StateGraph
	from pydantic.main import BaseModel
	from typing_extensions import List, TypedDict

	from langchain_cohere import CohereEmbeddings

	import re
	# from dotenv import load_dotenv
	from fastapi import FastAPI
	from fastapi.middleware.cors import CORSMiddleware
	from fastapi.responses import JSONResponse

	'''
	if not os.environ.get("GROQ_API_KEY"):
	os.environ["GROQ_API_KEY"] = getpass.getpass("Enter API key for Groq: ")
	'''

	# load_dotenv()

	# print(f"GROQ_API_KEY: {os.getenv('GROQ_API_KEY')}")
	# print(f"HUGGING_FACE_API_KEY: {os.getenv('HUGGING_FACE_API_KEY')}")

	llm = init_chat_model("deepseek-r1-distill-llama-70b", model_provider="groq", api_key=os.environ["GROQ_API_KEY"])
	'''
	embeddings = HuggingFaceInferenceAPIEmbeddings(
	api_key = os.getenv('HUGGING_FACE_API_KEY'),
	model_name="sentence-transformers/all-MiniLM-L6-v2"
	)

	embeddings = HuggingFaceInferenceAPIEmbeddings(
	api_key=os.getenv('HUGGING_FACE_API_KEY'), model_name="sentence-transformers/all-MiniLM-L6-v2"
	)'''

	embeddings = CohereEmbeddings(
	cohere_api_key=os.environ['COHERE'],
	model="embed-english-v3.0", # Added this line
	user_agent="langchain-cohere-embeddings"
	)

	vector_store = InMemoryVectorStore(embedding=embeddings)

	# Data - 1 and Data - 2
	data_1 = open(r'data_1.txt', 'r').read()
	data_2 = open(r'data_2.txt', 'r').read()
	data_3 = open(r'data_3.txt', 'r').read()
	data_4 = open(r'data_4.txt', 'r').read()

	comb = open(r'comb.txt', 'r').read()

	md_loader = UnstructuredMarkdownLoader('comb.md')

	text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=100)
	# all_splits = text_splitter.split_text(data_1 + "\n\n" + data_2 + "\n\n" + data_3 + "\n\n" + data_4)
	# all_splits = text_splitter.split_text(comb)
	all_splits = text_splitter.split_documents(md_loader.load())

	# docs = [Document(page_content=text) for text in all_splits]
	docs = [Document(page_content=text.page_content, metadata=text.metadata) for text in all_splits]
	_ = vector_store.add_documents(documents=docs)


	prompt = hub.pull("rlm/rag-prompt")

	class State(TypedDict):
	question: str
	context: List[Document]
	answer: str

	def retrieve(state: State):
	retrieved_docs = vector_store.similarity_search(state["question"])
	return {"context": retrieved_docs}

	def generate(state: State):
	docs_content = "\n\n".join(doc.page_content for doc in state["context"])
	messages = prompt.invoke({"question": state["question"], "context": docs_content})
	print(messages)
	response = llm.invoke(messages)
	return {"answer": response.content}

	graph_builder = StateGraph(State).add_sequence([retrieve, generate])
	graph_builder.add_edge(START, "retrieve")
	graph = graph_builder.compile()
	'''
	response = graph.invoke({"question": "Who should i contact for help ?"})
	print(response["answer"])
	'''

	app = FastAPI()

	origins = ["*"]

	app.add_middleware(
	CORSMiddleware,
	allow_origins=origins,
	allow_credentials=True,
	allow_methods=["GET", "POST", "PUT", "DELETE"],
	allow_headers=["*"],
	)

	@app.get("/ping")
	async def ping():
	return "Pong!"

	class Query(BaseModel):
	question: str

	@app.get("/chat")
	async def chat(request: Query):
	response = graph.invoke({"question": request.question})
	response = response["answer"]
	response = re.sub(r'<think>.*?</think>', '', response, flags=re.DOTALL)
	# response = response[4:]
	return {"response": response}

	@app.get("/")
	async def root():
	return {"message": "Hello World"}