Spaces:

markqiu
/

prinvest_mate

Sleeping

App Files Files Community

Tuchuanhuhuhu commited on May 18, 2023

Commit

93def2f

1 Parent(s): f8a0305

川虎助理和川虎助理Pro支持流式输出

Browse files

Files changed (3) hide show

config_example.json +1 -1
modules/models/ChuanhuAgent.py +31 -8
modules/models/base_model.py +73 -0

config_example.json CHANGED Viewed

@@ -17,7 +17,7 @@
     "default_model": "gpt-3.5-turbo", // 默认模型
     //川虎助理设置
-    "default_chuanhu_assistant_model": "gpt-4", //川虎助理使用的模型，可选gpt-3.5或者gpt-4
     "GOOGLE_CSE_ID": "", //谷歌搜索引擎ID，用于川虎助理Pro模式，获取方式请看 https://stackoverflow.com/questions/37083058/programmatically-searching-google-in-python-using-custom-search
     "GOOGLE_API_KEY": "", //谷歌API Key，用于川虎助理Pro模式
     "WOLFRAM_ALPHA_APPID": "", //Wolfram Alpha API Key，用于川虎助理Pro模式，获取方式请看 https://products.wolframalpha.com/api/

     "default_model": "gpt-3.5-turbo", // 默认模型
     //川虎助理设置
+    "default_chuanhu_assistant_model": "gpt-4", //川虎助理使用的模型，可选gpt-3.5-turbo或者gpt-4
     "GOOGLE_CSE_ID": "", //谷歌搜索引擎ID，用于川虎助理Pro模式，获取方式请看 https://stackoverflow.com/questions/37083058/programmatically-searching-google-in-python-using-custom-search
     "GOOGLE_API_KEY": "", //谷歌API Key，用于川虎助理Pro模式
     "WOLFRAM_ALPHA_APPID": "", //Wolfram Alpha API Key，用于川虎助理Pro模式，获取方式请看 https://products.wolframalpha.com/api/

modules/models/ChuanhuAgent.py CHANGED Viewed

@@ -1,8 +1,6 @@
 from langchain.chains.summarize import load_summarize_chain
-from langchain import OpenAI, PromptTemplate, LLMChain
 from langchain.chat_models import ChatOpenAI
-from langchain.text_splitter import CharacterTextSplitter
-from langchain.chains.mapreduce import MapReduceChain
 from langchain.prompts import PromptTemplate
 from langchain.text_splitter import TokenTextSplitter
 from langchain.embeddings import OpenAIEmbeddings
@@ -14,14 +12,23 @@ from langchain.agents import AgentType
 from langchain.docstore.document import Document
 from langchain.tools import BaseTool, StructuredTool, Tool, tool
 from langchain.callbacks.stdout import StdOutCallbackHandler
 from langchain.callbacks.manager import BaseCallbackManager
 from pydantic import BaseModel, Field
 import requests
 from bs4 import BeautifulSoup
-from .base_model import BaseLLMModel
 from ..config import default_chuanhu_assistant_model
 from ..presets import SUMMARIZE_PROMPT
 import logging
@@ -40,8 +47,9 @@ class ChuanhuAgent_Client(BaseLLMModel):
         self.text_splitter = TokenTextSplitter(chunk_size=500, chunk_overlap=30)
         self.api_key = openai_api_key
         self.llm = ChatOpenAI(openai_api_key=openai_api_key, temperature=0, model_name=default_chuanhu_assistant_model)
         PROMPT = PromptTemplate(template=SUMMARIZE_PROMPT, input_variables=["text"])
-        self.summarize_chain = load_summarize_chain(self.llm, chain_type="map_reduce", return_intermediate_steps=True, map_prompt=PROMPT, combine_prompt=PROMPT)
         if "Pro" in self.model_name:
             self.tools = load_tools(["google-search-results-json", "llm-math", "arxiv", "wikipedia", "wolfram-alpha"], llm=self.llm)
         else:
@@ -96,13 +104,28 @@ class ChuanhuAgent_Client(BaseLLMModel):
         # create vectorstore
         db = FAISS.from_documents(texts, embeddings)
         retriever = db.as_retriever()
-        qa = RetrievalQA.from_chain_type(llm=self.llm, chain_type="stuff", retriever=retriever)
         return qa.run(f"{question} Reply in 中文")
     def get_answer_at_once(self):
         question = self.history[-1]["content"]
-        manager = BaseCallbackManager(handlers=[StdOutCallbackHandler()])
         # llm=ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo")
-        agent = initialize_agent(self.tools, self.llm, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True, callback_manager=manager)
         reply = agent.run(input=f"{question} Reply in 简体中文")
         return reply, -1

 from langchain.chains.summarize import load_summarize_chain
+from langchain import PromptTemplate, LLMChain
 from langchain.chat_models import ChatOpenAI
 from langchain.prompts import PromptTemplate
 from langchain.text_splitter import TokenTextSplitter
 from langchain.embeddings import OpenAIEmbeddings
 from langchain.docstore.document import Document
 from langchain.tools import BaseTool, StructuredTool, Tool, tool
 from langchain.callbacks.stdout import StdOutCallbackHandler
+from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
 from langchain.callbacks.manager import BaseCallbackManager
+from typing import Any, Dict, List, Optional, Union
+from langchain.callbacks.base import BaseCallbackHandler
+from langchain.input import print_text
+from langchain.schema import AgentAction, AgentFinish, LLMResult
 from pydantic import BaseModel, Field
 import requests
 from bs4 import BeautifulSoup
+from threading import Thread, Condition
+from collections import deque
+from .base_model import BaseLLMModel, CallbackToIterator, ChuanhuCallbackHandler
 from ..config import default_chuanhu_assistant_model
 from ..presets import SUMMARIZE_PROMPT
 import logging
         self.text_splitter = TokenTextSplitter(chunk_size=500, chunk_overlap=30)
         self.api_key = openai_api_key
         self.llm = ChatOpenAI(openai_api_key=openai_api_key, temperature=0, model_name=default_chuanhu_assistant_model)
+        self.cheap_llm = ChatOpenAI(openai_api_key=openai_api_key, temperature=0, model_name="gpt-3.5-turbo")
         PROMPT = PromptTemplate(template=SUMMARIZE_PROMPT, input_variables=["text"])
+        self.summarize_chain = load_summarize_chain(self.cheap_llm, chain_type="map_reduce", return_intermediate_steps=True, map_prompt=PROMPT, combine_prompt=PROMPT)
         if "Pro" in self.model_name:
             self.tools = load_tools(["google-search-results-json", "llm-math", "arxiv", "wikipedia", "wolfram-alpha"], llm=self.llm)
         else:
         # create vectorstore
         db = FAISS.from_documents(texts, embeddings)
         retriever = db.as_retriever()
+        qa = RetrievalQA.from_chain_type(llm=self.cheap_llm, chain_type="stuff", retriever=retriever)
         return qa.run(f"{question} Reply in 中文")
     def get_answer_at_once(self):
         question = self.history[-1]["content"]
         # llm=ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo")
+        agent = initialize_agent(self.tools, self.llm, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
         reply = agent.run(input=f"{question} Reply in 简体中文")
         return reply, -1
+    def get_answer_stream_iter(self):
+        question = self.history[-1]["content"]
+        it = CallbackToIterator()
+        manager = BaseCallbackManager(handlers=[ChuanhuCallbackHandler(it.callback)])
+        def thread_func():
+            agent = initialize_agent(self.tools, self.llm, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True, callback_manager=manager)
+            reply = agent.run(input=f"{question} Reply in 简体中文")
+            it.callback(reply)
+            it.finish()
+        t = Thread(target=thread_func)
+        t.start()
+        partial_text = ""
+        for value in it:
+            partial_text += value
+            yield partial_text

modules/models/base_model.py CHANGED Viewed

@@ -18,12 +18,85 @@ import asyncio
 import aiohttp
 from enum import Enum
 from ..presets import *
 from ..index_func import *
 from ..utils import *
 from .. import shared
 from ..config import retrieve_proxy
 class ModelType(Enum):
     Unknown = -1

 import aiohttp
 from enum import Enum
+from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
+from langchain.callbacks.manager import BaseCallbackManager
+from typing import Any, Dict, List, Optional, Union
+from langchain.callbacks.base import BaseCallbackHandler
+from langchain.input import print_text
+from langchain.schema import AgentAction, AgentFinish, LLMResult
+from threading import Thread, Condition
+from collections import deque
 from ..presets import *
 from ..index_func import *
 from ..utils import *
 from .. import shared
 from ..config import retrieve_proxy
+class CallbackToIterator:
+    def __init__(self):
+        self.queue = deque()
+        self.cond = Condition()
+        self.finished = False
+    def callback(self, result):
+        with self.cond:
+            self.queue.append(result)
+            self.cond.notify()  # Wake up the generator.
+    def __iter__(self):
+        return self
+    def __next__(self):
+        with self.cond:
+            while not self.queue and not self.finished:  # Wait for a value to be added to the queue.
+                self.cond.wait()
+            if not self.queue:
+                raise StopIteration()
+            return self.queue.popleft()
+    def finish(self):
+        with self.cond:
+            self.finished = True
+            self.cond.notify()  # Wake up the generator if it's waiting.
+class ChuanhuCallbackHandler(BaseCallbackHandler):
+    def __init__(self, callback) -> None:
+        """Initialize callback handler."""
+        self.callback = callback
+    def on_agent_action(
+        self, action: AgentAction, color: Optional[str] = None, **kwargs: Any
+    ) -> Any:
+        self.callback(action.log)
+    def on_tool_end(
+        self,
+        output: str,
+        color: Optional[str] = None,
+        observation_prefix: Optional[str] = None,
+        llm_prefix: Optional[str] = None,
+        **kwargs: Any,
+    ) -> None:
+        """If not the final action, print out observation."""
+        if observation_prefix is not None:
+            self.callback(f"\n\n{observation_prefix}")
+        self.callback(output)
+        if llm_prefix is not None:
+            self.callback(f"\n\n{llm_prefix}")
+    def on_agent_finish(
+        self, finish: AgentFinish, color: Optional[str] = None, **kwargs: Any
+    ) -> None:
+        self.callback(f"{finish.log}\n\n")
+    def on_llm_new_token(self, token: str, **kwargs: Any) -> None:
+        """Run on new LLM token. Only available when streaming is enabled."""
+        self.callback(token)
 class ModelType(Enum):
     Unknown = -1