textgenerationAI

Running

App Files Files Community

dedlepexa commited on Apr 13

Commit

ebaea68

verified ·

1 Parent(s): 6e368de

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -17

app.py CHANGED Viewed

@@ -16,18 +16,16 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 model.eval()
-# 🔹 настройки
 MAX_HISTORY = 40
 NUM_WORKERS = 3
-db = OrderedDict()   # message -> {status, reply}
 queue = []
 class Message(BaseModel):
     message: str
-# 🔥 STREAMING GENERATION
 def generate_ai_stream(message: str):
     prompt = f"User: {message}\nAssistant: Answer clearly and fully:\n"
@@ -51,24 +49,22 @@ def generate_ai_stream(message: str):
     partial = ""
     for text in streamer:
         partial += text
-        # 🔥 обновляем ответ в реальном времени
         if message in db:
             db[message]["reply"] = partial
- final_text = partial.strip() + " full generated"
     if message in db:
         db[message]["reply"] = final_text
-        db[message]["status"] = "done"
     return final_text
-# 🔥 WORKER
 def worker():
     while True:
         if queue:
@@ -86,7 +82,6 @@ def worker():
             time.sleep(0.01)
-# 🔥 запускаем 3 воркера (ускорение x2-x3)
 for _ in range(NUM_WORKERS):
     threading.Thread(target=worker, daemon=True).start()
@@ -96,19 +91,14 @@ async def root():
     return PlainTextResponse("AI server работает")
-# 🔹 ASK
 @app.get("/ask")
 async def ask(message: str):
-    # кеш
     if message in db and db[message]["status"] == "done":
         return PlainTextResponse("cached")
     if message not in db:
-        db[message] = {
-            "status": "pending",
-            "reply": ""
-        }
         queue.append(message)
         if len(db) > MAX_HISTORY:
@@ -117,7 +107,6 @@ async def ask(message: str):
     return PlainTextResponse("accepted")
-# 🔹 GET (визуальный стриминг)
 @app.get("/get")
 async def get(message: str):

 model = AutoModelForCausalLM.from_pretrained(model_name)
 model.eval()
 MAX_HISTORY = 40
 NUM_WORKERS = 3
+db = OrderedDict()
 queue = []
 class Message(BaseModel):
     message: str
 def generate_ai_stream(message: str):
     prompt = f"User: {message}\nAssistant: Answer clearly and fully:\n"
     partial = ""
+    # 🔥 STREAMING
     for text in streamer:
         partial += text
         if message in db:
             db[message]["reply"] = partial
+    # 🔥 КОНЕЦ ГЕНЕРАЦИИ (ВОТ ТУТ ДЕТЕКТ)
+    final_text = partial.strip() + " full generated"
     if message in db:
         db[message]["reply"] = final_text
     return final_text
 def worker():
     while True:
         if queue:
             time.sleep(0.01)
 for _ in range(NUM_WORKERS):
     threading.Thread(target=worker, daemon=True).start()
     return PlainTextResponse("AI server работает")
 @app.get("/ask")
 async def ask(message: str):
     if message in db and db[message]["status"] == "done":
         return PlainTextResponse("cached")
     if message not in db:
+        db[message] = {"status": "pending", "reply": ""}
         queue.append(message)
         if len(db) > MAX_HISTORY:
     return PlainTextResponse("accepted")
 @app.get("/get")
 async def get(message: str):