textgenerationAI

Sleeping

dedlepexa commited on Mar 7

Commit

34224fe

verified ·

1 Parent(s): 81b2953

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
-from fastapi import FastAPI
 from fastapi.responses import PlainTextResponse
-from pydantic import BaseModel
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
@@ -13,20 +12,8 @@ model = AutoModelForCausalLM.from_pretrained(model_name)
 model.eval()
-class Message(BaseModel):
-    message: str
-@app.get("/")
-async def root():
-    return {"status": "TinyLlama работает"}
-from fastapi import Request
-@app.post("/")
-async def receive(request: Request):
-    data = await request.json()
-    message = data.get("message", "")
     prompt = f"User: {message}\nAssistant:"
@@ -35,7 +22,7 @@ async def receive(request: Request):
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=20,
             do_sample=False
         )
@@ -44,14 +31,37 @@ async def receive(request: Request):
     if "Assistant:" in reply:
         reply = reply.split("Assistant:")[-1].strip()
-    return PlainTextResponse(reply)
-    reply = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    if "Assistant:" in reply:
-        reply = reply.split("Assistant:")[-1].strip()
-    return PlainTextResponse(reply)
 if __name__ == "__main__":

+from fastapi import FastAPI, Request
 from fastapi.responses import PlainTextResponse
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 model.eval()
+def generate_ai(message: str):
     prompt = f"User: {message}\nAssistant:"
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=25,
             do_sample=False
         )
     if "Assistant:" in reply:
         reply = reply.split("Assistant:")[-1].strip()
+    return reply
+@app.get("/")
+async def root():
+    return PlainTextResponse("AI server работает")
+@app.api_route("/", methods=["GET","POST","PUT","PATCH","DELETE","HEAD"])
+async def universal(request: Request):
+    try:
+        # пробуем получить JSON
+        try:
+            data = await request.json()
+            message = data.get("message", "")
+        except:
+            # если не JSON — читаем обычный текст
+            body = await request.body()
+            message = body.decode("utf-8")
+        if not message:
+            message = "Hello"
+        reply = generate_ai(message)
+        return PlainTextResponse(reply)
+    except Exception as e:
+        return PlainTextResponse(f"ERROR: {str(e)}")
 if __name__ == "__main__":