Spaces:

retopara
/

ragflow

Build error

App Files Files Community

黄腾

aopstudio commited on Aug 12, 2024

Commit

ce69533

1 Parent(s): 6108c20

add support for PerfXCloud (#1883)

Browse files

### What problem does this PR solve?

#1853 add support for PerfXCloud

### Type of change

- [x] New Feature (non-breaking change which adds functionality)

Co-authored-by: Zhedong Cen <cenzhedong2@126.com>

Files changed (6) hide show

conf/llm_factories.json +153 -1
rag/llm/__init__.py +4 -2
rag/llm/chat_model.py +8 -1
rag/llm/embedding_model.py +7 -0
web/src/assets/svg/llm/perfx-cloud.svg +11 -0
web/src/pages/user-setting/setting-model/constant.ts +1 -0

conf/llm_factories.json CHANGED Viewed

@@ -2442,6 +2442,158 @@
                     "model_type": "chat"
                 }
             ]
-        }
     ]
 }

                     "model_type": "chat"
                 }
             ]
+        },
+        {
+            "name": "PerfXCloud",
+            "logo": "",
+            "tags": "LLM,TEXT EMBEDDING",
+            "status": "1",
+            "llm": [
+                {
+                    "llm_name": "deepseek-v2-chat",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "llama3.1:405b",
+                    "tags": "LLM,CHAT,128k",
+                    "max_tokens": 131072,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen2-72B-Instruct",
+                    "tags": "LLM,CHAT,128k",
+                    "max_tokens": 131072,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen2-72B-Instruct-GPTQ-Int4",
+                    "tags": "LLM,CHAT,2k",
+                    "max_tokens": 2048,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen2-72B-Instruct-awq-int4",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Llama3-Chinese_v2",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Yi-1_5-9B-Chat-16K",
+                    "tags": "LLM,CHAT,16k",
+                    "max_tokens": 16384,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen1.5-72B-Chat-GPTQ-Int4",
+                    "tags": "LLM,CHAT,2k",
+                    "max_tokens": 2048,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Meta-Llama-3.1-8B-Instruct",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen2-7B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "deepseek-v2-lite-chat",
+                    "tags": "LLM,CHAT,2k",
+                    "max_tokens": 2048,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen2-7B",
+                    "tags": "LLM,CHAT,128k",
+                    "max_tokens": 131072,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "chatglm3-6b",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Meta-Llama-3-70B-Instruct-GPTQ-Int4",
+                    "tags": "LLM,CHAT,1k",
+                    "max_tokens": 1024,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Meta-Llama-3-8B-Instruct",
+                    "tags": "LLM,CHAT,8k",
+                    "max_tokens": 8192,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Mistral-7B-Instruct",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "MindChat-Qwen-7B-v2",
+                    "tags": "LLM,CHAT,2k",
+                    "max_tokens": 2048,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "phi-2",
+                    "tags": "LLM,CHAT,2k",
+                    "max_tokens": 2048,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "SOLAR-10_7B-Instruct",
+                    "tags": "LLM,CHAT,4k",
+                    "max_tokens": 4096,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Mixtral-8x7B-Instruct-v0.1-GPTQ",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "Qwen1.5-7B",
+                    "tags": "LLM,CHAT,32k",
+                    "max_tokens": 32768,
+                    "model_type": "chat"
+                },
+                {
+                    "llm_name": "BAAI/bge-large-en-v1.5",
+                    "tags": "TEXT EMBEDDING",
+                    "max_tokens": 512,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "BAAI/bge-large-zh-v1.5",
+                    "tags": "TEXT EMBEDDING",
+                    "max_tokens": 1024,
+                    "model_type": "embedding"
+                },
+                {
+                    "llm_name": "BAAI/bge-m3",
+                    "tags": "TEXT EMBEDDING",
+                    "max_tokens": 8192,
+                    "model_type": "embedding"
+                }
+            ]
+        }
     ]
 }

rag/llm/__init__.py CHANGED Viewed

@@ -38,7 +38,8 @@ EmbeddingModel = {
     "NVIDIA": NvidiaEmbed,
     "LM-Studio": LmStudioEmbed,
     "OpenAI-API-Compatible": OpenAI_APIEmbed,
-    "cohere": CoHereEmbed
 }
@@ -84,7 +85,8 @@ ChatModel = {
     "LM-Studio": LmStudioChat,
     "OpenAI-API-Compatible": OpenAI_APIChat,
     "cohere": CoHereChat,
-    "LeptonAI": LeptonAIChat
 }

     "NVIDIA": NvidiaEmbed,
     "LM-Studio": LmStudioEmbed,
     "OpenAI-API-Compatible": OpenAI_APIEmbed,
+    "cohere": CoHereEmbed,
+    "PerfXCloud": PerfXCloudEmbed,
 }
     "LM-Studio": LmStudioChat,
     "OpenAI-API-Compatible": OpenAI_APIChat,
     "cohere": CoHereChat,
+    "LeptonAI": LeptonAIChat,
+    "PerfXCloud": PerfXCloudChat
 }

rag/llm/chat_model.py CHANGED Viewed

@@ -987,4 +987,11 @@ class LeptonAIChat(Base):
     def __init__(self, key, model_name, base_url=None):
         if not base_url:
             base_url = os.path.join("https://"+model_name+".lepton.run","api","v1")
-        super().__init__(key, model_name, base_url)

     def __init__(self, key, model_name, base_url=None):
         if not base_url:
             base_url = os.path.join("https://"+model_name+".lepton.run","api","v1")
+        super().__init__(key, model_name, base_url)
+class PerfXCloudChat(Base):
+    def __init__(self, key, model_name, base_url="https://cloud.perfxlab.cn/v1"):
+        if not base_url:
+            base_url = "https://cloud.perfxlab.cn/v1"
+        super().__init__(key, model_name, base_url)

rag/llm/embedding_model.py CHANGED Viewed

@@ -553,3 +553,10 @@ class CoHereEmbed(Base):
         return np.array([d for d in res.embeddings.float]), int(
             res.meta.billed_units.input_tokens
         )

         return np.array([d for d in res.embeddings.float]), int(
             res.meta.billed_units.input_tokens
         )
+class PerfXCloudEmbed(OpenAIEmbed):
+    def __init__(self, key, model_name, base_url="https://cloud.perfxlab.cn/v1"):
+        if not base_url:
+            base_url = "https://cloud.perfxlab.cn/v1"
+        super().__init__(key, model_name, base_url)

web/src/assets/svg/llm/perfx-cloud.svg ADDED Viewed

web/src/pages/user-setting/setting-model/constant.ts CHANGED Viewed

@@ -25,6 +25,7 @@ export const IconMap = {
   'OpenAI-API-Compatible': 'openai-api',
   cohere: 'cohere',
   Lepton: 'lepton',
 };
 export const BedrockRegionList = [

   'OpenAI-API-Compatible': 'openai-api',
   cohere: 'cohere',
   Lepton: 'lepton',
+  PerfXCould: 'perfx-could'
 };
 export const BedrockRegionList = [