Spaces:

rafaaa2105
/

chainlit-chatbot

Build error

App Files Files Community

rafaaa2105 commited on Mar 14, 2024

Commit

d7c2b37

verified ·

1 Parent(s): 37c38c8

Update app.py

Browse files

Files changed (1) hide show

app.py +168 -54

app.py CHANGED Viewed

@@ -1,57 +1,171 @@
-from langchain import hub
-from langchain.agents import AgentExecutor, load_tools
-from langchain.agents.format_scratchpad import format_log_to_str
-from langchain.agents.output_parsers import ReActJsonSingleInputOutputParser
-from langchain.tools.render import render_text_description
-from langchain_community.llms import HuggingFaceHub
-from langchain_community.utilities import SerpAPIWrapper
-from langchain_community.chat_models.huggingface import ChatHuggingFace
 import chainlit as cl
-# Instantiate the LLM
-llm = HuggingFaceHub(
-    repo_id="mistralai/Mixtral-8x7B-Instruct-v0.1",
-    task="text-generation",
-    model_kwargs={
-        "max_new_tokens": 2048,
-        "top_k": 30,
-        "temperature": 0.7,
-        "repetition_penalty": 1.03,
-    },
-)
-# Setup tools
-tools = load_tools(["serpapi", "llm-math"], llm=llm)
-# Setup ReAct style prompt
-prompt = hub.pull("hwchase17/react-json")
-prompt = prompt.partial(
-    tools=render_text_description(tools),
-    tool_names=", ".join([t.name for t in tools]),
-)
-# Define the agent
-chat_model_with_stop = ChatHuggingFace(llm=llm).bind(stop=["\nObservation"])
-agent = (
-    {
-        "input": lambda x: x["input"],
-        "agent_scratchpad": lambda x: format_log_to_str(x["intermediate_steps"]),
     }
-    | prompt
-    | chat_model_with_stop
-    | ReActJsonSingleInputOutputParser()
-)
-# Instantiate AgentExecutor
-agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
-# Create the Chainlit app
-@cl.chainlit_app
-def app():
-    question = cl.get_text_input("Enter your question")
-    if question:
-        response = agent_executor.invoke({"input": question})
-        cl.display_output(response["output"])
-# Run the app
-app()

+import os
+import json
 import chainlit as cl
+from embedchain import Pipeline as App
+from datetime import datetime
+try:
+    HF_TOKEN = os.environ['HUGGINGFACEHUB_API_TOKEN']
+    if HF_TOKEN is None:
+        raise ValueError('HUGGINGFACE_API_KEY is not set')
+except Exception as err:
+    raise(err)
+class DatabaseError(Exception):
+    pass
+class JSONDB:
+    def __init__(self, file_path):
+        self.file_path = file_path
+    def _create_file_if_not_exists(self):
+        if not os.path.exists(self.file_path):
+            with open(self.file_path, 'w') as fp:
+                json.dump([], fp)
+    def add_record(self, record):
+        try:
+            self._create_file_if_not_exists()
+            with open(self.file_path, 'r+') as fp:
+                try:
+                    data = json.load(fp)
+                    if record not in data:
+                        data.append(record)
+                    else:
+                        pass
+                except Exception as err:
+                    print(f'[DEBUG] Error adding record: {str(err)}')
+                    raise(err)
+                fp.seek(0)
+                json.dump(data, fp, indent=4)
+        except (FileNotFoundError, json.JSONDecodeError, IOError) as e:
+            raise DatabaseError(f"Error adding record: {str(e)}")
+    def get_all_records(self):
+        try:
+            with open(self.file_path, 'r') as fp:
+                # Attempt to load data, handle empty file scenario
+                try:
+                    data = json.load(fp)
+                except json.JSONDecodeError:
+                    data = []
+            return data
+        except (FileNotFoundError, IOError) as e:
+            raise DatabaseError(f"Error getting all records: {str(e)}")
+    def get_top_records(self, n):
+        try:
+            records = self.get_all_records()
+            sorted_records = sorted(records, key=lambda x: x.get('added', 0), reverse=True)
+            return sorted_records[:n]
+        except (FileNotFoundError, json.JSONDecodeError, IOError) as e:
+            raise DatabaseError(f"Error getting top records: {str(e)}")
+@cl.on_chat_start
+async def setup_app():
+    app = App.from_config(config_path='data/config.yaml')
+    app.collect_metrics = False
+    cl.user_session.set('app', app)
+    db = JSONDB('data/index.json')
+    cl.user_session.set('db', db)
+def update_db(data):
+    db = cl.user_session.get('db')
+    record = {
+        'url': data,  # Store the URL as a JSON field
+        'added': datetime.now().strftime('%d/%m/%Y %H:%M:%S')
     }
+    db.add_record(record)
+@cl.on_message
+async def main(message: cl.Message):
+    task_list = cl.TaskList()
+    task_list.status = 'Running...'
+    app = cl.user_session.get('app')
+    msg = cl.Message(content='')
+    user_message = message.content
+    if user_message.startswith('/help'):
+        markdown_content = "| Command | Description |\n| --- | --- |\n"
+        markdown_content += "| /add | Add a document to the knowledge base |\n"
+        markdown_content += "| /kb | Display the knowledge base |\n"
+        markdown_content += "| /help | Display the available commands |\n"
+        markdown_content += "| * | Chat with the AI |\n"
+        await cl.Message(
+            content=markdown_content
+        ).send()
+    elif user_message.startswith('/add'):
+        data = user_message.replace('/add', '').strip()
+        db = cl.user_session.get('db')
+        records = db.get_all_records()
+        if data in [record['url'] for record in records]:
+            await cl.Message(
+                content='This document already exists in the knowledge base!'
+            ).send()
+        else:
+            add_task = cl.Task(title='Adding to knowledge base', status=cl.TaskStatus.RUNNING)
+            await task_list.add_task(add_task)
+            await task_list.send()
+            app.add(data)
+            update_db(data)
+            add_task.status = cl.TaskStatus.DONE
+            await task_list.send()
+            await cl.Message(
+                content='Added data to knowledge base!'
+            ).send()
+    elif user_message.startswith('/kb'):
+        kb_task = cl.Task(title='Getting records', status=cl.TaskStatus.RUNNING)
+        await task_list.add_task(kb_task)
+        await task_list.send()
+        data = cl.user_session.get('db').get_top_records(25)
+        kb_task.status = cl.TaskStatus.DONE
+        await task_list.send()
+        if len(data) == 0:
+            await cl.Message(
+                content='No documents in json index!'
+            ).send()
+        else:
+            markdown_content = "| URL | Added |\n| --- | --- |\n"
+            for record in data:
+                url = record['url']
+                added = record['added']
+                markdown_content += f"| {url} | {added} |\n"
+            await cl.Message(
+                content=markdown_content
+            ).send()
+    else:
+        chat_task = cl.Task(title='Querying LLM', status=cl.TaskStatus.RUNNING)
+        await task_list.add_task(chat_task)
+        await task_list.send()
+        for chunk in await cl.make_async(app.chat)(message.content):
+            await msg.stream_token(chunk)
+        chat_task.status = cl.TaskStatus.DONE
+        await task_list.send()
+    await msg.send()