Spaces:

eoinmcg
/

AI_project

Build error

AI_project / app.py

Eoin McGrath

initial commit

257dcc1 10 months ago

4.59 kB

	import logging
	import os

	import gradio as gr

	from llama_index.core.retrievers import VectorIndexRetriever
	from llama_index.core.llms import MessageRole
	from llama_index.core.memory import ChatSummaryMemoryBuffer
	from llama_index.core.tools import RetrieverTool, ToolMetadata
	from llama_index.agent.openai import OpenAIAgent
	from llama_index.embeddings.openai import OpenAIEmbedding
	from llama_index.llms.openai import OpenAI
	from llama_index.core import Settings
	from llama_index.core.postprocessor import LLMRerank

	from utils import create_db, load_db, load_asset
	from config import CHROMA_PATH, PLACEHOLDER, TITLE, PROMPT_SYSTEM_MESSAGE, TEXT_QA_TEMPLATE


	logger = logging.getLogger(__name__)
	logging.basicConfig(level=logging.INFO)
	logging.getLogger("httpx").setLevel(logging.WARNING)


	API_KEY=""
	token_count = 0

	def create_knowledge_base_if_not_exists():
	if not os.path.exists(CHROMA_PATH) or not os.listdir(CHROMA_PATH):
	print("⚠️ ChromaDB not found. Creating DB...")
	create_db()

	def get_tools():
	index = load_db()
	vector_retriever = VectorIndexRetriever(
	index=index,
	similarity_top_k=15,
	embed_model=Settings.embed_model,
	use_async=True,
	)

	# Add LLMRerank for better retrieval
	reranker = LLMRerank(
	choice_batch_size=5,
	top_n=3,
	)

	def retrieve_with_rerank(query):
	retrieved_docs = vector_retriever.retrieve(query)
	reranked_docs = reranker.postprocess(retrieved_docs)
	return reranked_docs

	tools = [
	RetrieverTool(
	# retriever=vector_retriever,
	retriever=retrieve_with_rerank,
	metadata=ToolMetadata(
	name="LitleJS_related_resources",
	description="Useful for info related to the LittleJS game development library. It gathers the info from local data.",
	),
	)
	]
	return tools

	def set_api_key(key):
	API_KEY=key
	Settings.llm = OpenAI(temperature=0, model="gpt-4o-mini", api_key=API_KEY)
	Settings.embed_model = OpenAIEmbedding(model="text-embedding-3-small")


	def generate_completion(query, history, memory, api_key):
	logging.info(f"User query: {query}")

	if not API_KEY:
	set_api_key(api_key)

	# Manage memory
	chat_list = memory.get()
	if len(chat_list) != 0:
	user_index = [i for i, msg in enumerate(chat_list) if msg.role == MessageRole.USER]
	if len(user_index) > len(history):
	user_index_to_remove = user_index[len(history)]
	chat_list = chat_list[:user_index_to_remove]
	memory.set(chat_list)
	logging.info(f"chat_history: {len(memory.get())} {memory.get()}")
	logging.info(f"gradio_history: {len(history)} {history}")

	# Create agent
	tools = get_tools()

	agent = OpenAIAgent.from_tools(
	llm=Settings.llm,
	memory=memory,
	tools=tools,
	system_prompt=PROMPT_SYSTEM_MESSAGE,
	)

	# Generate answer
	completion = agent.stream_chat(query)
	answer_str = ""
	for token in completion.response_gen:
	answer_str += token
	global token_count
	token_count += 1 # Update token count
	yield answer_str



	def launch_ui():

	js=load_asset("./assets/chat.js")

	with gr.Blocks(
	title=TITLE,
	fill_height=True,
	analytics_enabled=True,
	css=load_asset("./assets/style.css"),
	js=load_asset("./assets/chat.js"),
	) as demo:

	api_key_input = gr.Textbox(
	label="Enter your OpenAI API Key",
	type="password",
	placeholder="sk-...",
	elem_classes="api_key_input"
	)

	memory_state = gr.State(
	lambda: ChatSummaryMemoryBuffer.from_defaults(
	token_limit=120000,
	)
	)
	chatbot = gr.Chatbot(
	scale=1,
	placeholder=PLACEHOLDER,
	type='messages',
	show_label=False,
	show_copy_button=True,
	elem_classes="chatbox",
	)

	gr.ChatInterface(
	fn=generate_completion,
	chatbot=chatbot,
	type='messages',
	additional_inputs=[memory_state, api_key_input],
	)

	token_counter = gr.Button("Tokens Used: 0", elem_classes="token_counter")

	demo.queue(default_concurrency_limit=64)
	demo.launch(debug=True, favicon_path="./assets/favicon.png", share=False) # Set share=True to share the app online


	if __name__ == "__main__":
	create_knowledge_base_if_not_exists()
	launch_ui()