Spaces:

MatveyDM028
/

hello

Sleeping

App Files Files Community

MatveyDM028 commited on Feb 15, 2025

Commit

de71310

verified ·

1 Parent(s): fb8bce6

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -14

app.py CHANGED Viewed

@@ -1,31 +1,57 @@
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from huggingface_hub import InferenceClient
 # Инициализация FastAPI
 app = FastAPI()
-# Инициализация клиента для модели
-client = InferenceClient("Qwen/Qwen2.5-Coder-32B-Instruct")
 # Модель данных для запроса
 class ChatRequest(BaseModel):
     message: str
-    history: list[tuple[str, str]] = []
-    system_message: str = "You are a friendly Chatbot."
-    max_tokens: int = 512
-    temperature: float = 0.7
-    top_p: float = 0.95
 # Маршрут для обработки запросов
 @app.post("/chat")
 async def chat(request: ChatRequest):
     try:
         # Формируем сообщения для модели
-        messages = [{"role": "system", "content": request.system_message}]
         # Добавляем историю диалога
-        for user_msg, assistant_msg in request.history:
             if user_msg:
                 messages.append({"role": "user", "content": user_msg})
             if assistant_msg:
@@ -38,20 +64,35 @@ async def chat(request: ChatRequest):
         response = ""
         for message in client.chat_completion(
             messages,
-            max_tokens=request.max_tokens,
             stream=True,
-            temperature=request.temperature,
-            top_p=request.top_p,
         ):
             token = message.choices[0].delta.content
             response += token
-        # Возвращаем ответ
-        return {"response": response}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 # Запуск приложения (для локального тестирования)
 if __name__ == "__main__":
     import uvicorn

 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from huggingface_hub import InferenceClient
+from typing import List, Tuple, Optional
 # Инициализация FastAPI
 app = FastAPI()
+# Глобальные переменные для хранения состояния
+client = None
+system_message = "You are a friendly Chatbot."
+max_tokens = 1024
+temperature = 0.7
+top_p = 0.95
+history = []
+total_tokens = 0
 # Модель данных для запроса
 class ChatRequest(BaseModel):
     message: str
+    reset_history: bool = False  # Флаг для очистки истории
+# Инициализация модели
+def initialize_model(
+    model_name: str = "Qwen/Qwen2.5-Coder-32B-Instruct",
+    sys_message: str = "You are a friendly Chatbot.",
+    tokens: int = 1024,
+    temp: float = 0.7,
+    top_p_value: float = 0.95,
+):
+    global client, system_message, max_tokens, temperature, top_p
+    client = InferenceClient(model_name)
+    system_message = sys_message
+    max_tokens = tokens
+    temperature = temp
+    top_p = top_p_value
 # Маршрут для обработки запросов
 @app.post("/chat")
 async def chat(request: ChatRequest):
+    global history, total_tokens
     try:
+        # Очистка истории, если запрошено
+        if request.reset_history:
+            history = []
+            total_tokens = 0
+            return {"response": "History cleared.", "total_tokens": total_tokens}
         # Формируем сообщения для модели
+        messages = [{"role": "system", "content": system_message}]
         # Добавляем историю диалога
+        for user_msg, assistant_msg in history:
             if user_msg:
                 messages.append({"role": "user", "content": user_msg})
             if assistant_msg:
         response = ""
         for message in client.chat_completion(
             messages,
+            max_tokens=max_tokens,
             stream=True,
+            temperature=temperature,
+            top_p=top_p,
         ):
             token = message.choices[0].delta.content
             response += token
+        # Обновляем историю и счетчик токенов
+        history.append((request.message, response))
+        total_tokens += len(response.split())  # Примерный подсчет токенов
+        # Возвращаем ответ и количество токенов
+        return {"response": response, "total_tokens": total_tokens}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+# Маршрут для получения текущего состояния (история и токены)
+@app.get("/status")
+async def get_status():
+    return {
+        "history": history,
+        "total_tokens": total_tokens,
+    }
+# Инициализация модели при запуске
+initialize_model()
 # Запуск приложения (для локального тестирования)
 if __name__ == "__main__":
     import uvicorn