Spaces:

AxusAI
/

apex-engine

Runtime error

App Files Files Community

Garush65 commited on Dec 14, 2025

Commit

7e3b33d

verified ·

1 Parent(s): 3c5968a

Upload 3 files

Browse files

Files changed (3) hide show

Dockerfile +24 -0
app.py +70 -0
requirements.txt +5 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,24 @@

+# Используем легкий Python
+FROM python:3.10-slim
+# Устанавливаем системные утилиты для сборки (нужно для llama.cpp)
+RUN apt-get update && apt-get install -y \
+    build-essential \
+    cmake \
+    && rm -rf /var/lib/apt/lists/*
+# Создаем папку приложения
+WORKDIR /app
+# Копируем список библиотек и ставим их
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+# Копируем код приложения
+COPY . .
+# Открываем порт 7860 (HuggingFace требует именно его!)
+EXPOSE 7860
+# Запускаем сервер
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

	@@ -0,0 +1,70 @@

+from fastapi import FastAPI
+from pydantic import BaseModel
+from llama_cpp import Llama
+from huggingface_hub import hf_hub_download
+from fastapi.middleware.cors import CORSMiddleware
+# 1. Скачиваем модель прямо при запуске сервера
+# Qwen2.5-0.5B-Instruct (умная, понимает русский)
+model_name = "Qwen/Qwen2.5-0.5B-Instruct-GGUF"
+model_file = "qwen2.5-0.5b-instruct-q4_k_m.gguf" # Самая сбалансированная версия
+print(f"Загрузка модели {model_file}...")
+model_path = hf_hub_download(repo_id=model_name, filename=model_file)
+print("Модель скачана:", model_path)
+# 2. Инициализируем нейросеть
+llm = Llama(
+    model_path=model_path,
+    n_ctx=4096,       # Память контекста (статьи википедии влезут)
+    n_threads=2       # Количество ядер
+)
+# 3. Настройка FastAPI
+app = FastAPI()
+# Разрешаем запросы с твоего сайта (CORS)
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"], # Брат, для тестов пока можно всем (*), потом можешь ограничить
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+class AnalysisRequest(BaseModel):
+    context: str
+    query: str
+@app.get("/")
+def home():
+    return {"status": "Apex Brain is Running"}
+@app.post("/analyze")
+def analyze(req: AnalysisRequest):
+    # Промпт для Qwen (формат ChatML)
+    prompt = f"""<|im_start|>system
+Ты — Apex, эпистемический движок. Твоя цель — проанализировать контекст и ответить на вопрос пользователя.
+Отвечай кратко, емко, научно. Используй русский язык.
+Если в тексте есть противоречия или белые пятна — укажи на них.
+<|im_end|>
+<|im_start|>user
+Контекст:
+{req.context}
+Вопрос пользователя:
+{req.query}
+<|im_end|>
+<|im_start|>assistant
+"""
+    # Генерация
+    output = llm(
+        prompt,
+        max_tokens=500,  # Длина ответа
+        temperature=0.3, # Меньше галлюцинаций
+        stop=["<|im_end|>"],
+        echo=False
+    )
+    return {"result": output["choices"][0]["text"]}

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+fastapi
+uvicorn
+pydantic
+huggingface_hub
+llama-cpp-python