Spaces:

Rid3
/

xtime-api

Sleeping

App Files Files Community

Rid3 commited on Mar 27

Commit

9560ef7

verified ·

1 Parent(s): 461bc4b

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -22

app.py CHANGED Viewed

@@ -1,18 +1,26 @@
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
 import gc
-import os
 app = FastAPI(title="RID3 QUANTUM AI API")
-# Конфигурация твоего хранилища
 REPO_ID = "Rid3/xtime-v1beta-gguf-storage"
 current_llm = None
 current_model_name = ""
-# Твои файлы (из скриншота)
 MODELS = {
     "medium": "xtime-v1beta-n-m_1p.gguf",
     "large": "xtime-v1beta-q4_K_M.gguf",
@@ -21,52 +29,40 @@ MODELS = {
 def load_model(model_key: str):
     global current_llm, current_model_name
     filename = MODELS.get(model_key)
     if not filename:
-        raise HTTPException(status_code=404, detail="Модель не найдена в списке")
     if current_model_name == model_key:
         return
-    print(f"Загрузка модели {filename} из {REPO_ID}...")
     if current_llm is not None:
         del current_llm
         gc.collect()
     try:
-        # Скачиваем файл из твоего репозитория моделей
         model_path = hf_hub_download(repo_id=REPO_ID, filename=filename)
-        # Инициализация модели
-        current_llm = Llama(
-            model_path=model_path,
-            n_ctx=2048,
-            n_threads=4 # Оптимально для бесплатных CPU на HF
-        )
         current_model_name = model_key
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
-# При старте грузим самую маленькую, чтобы Space быстро запустился
 @app.on_event("startup")
 async def startup_event():
-    load_model("small")
 class ChatRequest(BaseModel):
     prompt: str
-    model_type: str = "small" # Можно присылать "small", "medium" или "large"
 @app.post("/chat")
 async def chat(request: ChatRequest):
     if request.model_type != current_model_name:
         load_model(request.model_type)
     output = current_llm(
-        f"Q: {request.prompt} A:",
         max_tokens=256,
-        stop=["Q:", "\n"],
         echo=False
     )
     return {"response": output["choices"][0]["text"].strip()}

 from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware # Добавь это
 from pydantic import BaseModel
 from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
 import gc
 app = FastAPI(title="RID3 QUANTUM AI API")
+# --- НАСТРОЙКА CORS ---
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],  # Разрешить запросы с любых сайтов
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+# ----------------------
 REPO_ID = "Rid3/xtime-v1beta-gguf-storage"
 current_llm = None
 current_model_name = ""
 MODELS = {
     "medium": "xtime-v1beta-n-m_1p.gguf",
     "large": "xtime-v1beta-q4_K_M.gguf",
 def load_model(model_key: str):
     global current_llm, current_model_name
     filename = MODELS.get(model_key)
     if not filename:
+        raise HTTPException(status_code=404, detail="Модель не найдена")
     if current_model_name == model_key:
         return
     if current_llm is not None:
         del current_llm
         gc.collect()
     try:
         model_path = hf_hub_download(repo_id=REPO_ID, filename=filename)
+        current_llm = Llama(model_path=model_path, n_ctx=2048, n_threads=4)
         current_model_name = model_key
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
 @app.on_event("startup")
 async def startup_event():
+    load_model("large")
 class ChatRequest(BaseModel):
     prompt: str
+    model_type: str = "large"
 @app.post("/chat")
 async def chat(request: ChatRequest):
     if request.model_type != current_model_name:
         load_model(request.model_type)
     output = current_llm(
+        f"User: {request.prompt}\nAI:",
         max_tokens=256,
+        stop=["User:", "\n"],
         echo=False
     )
     return {"response": output["choices"][0]["text"].strip()}