Spaces:

AxusAI
/

apex-engine

Runtime error

App Files Files Community

Garush65 commited on Dec 14, 2025

Commit

868dc46

verified ·

1 Parent(s): ba1690d

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -12

app.py CHANGED Viewed

@@ -5,31 +5,32 @@ from huggingface_hub import hf_hub_download
 from fastapi.middleware.cors import CORSMiddleware
 import os
-# --- КОНФИГУРАЦИЯ МОДЕЛИ ---
-# Qwen2.5-7B-Instruct (Умная, мощная, русский язык)
-REPO_ID = "Qwen/Qwen2.5-7B-Instruct-GGUF"
-FILENAME = "qwen2.5-7b-instruct-q4_k_m.gguf"
-print(f"System: Начинаю загрузку модели {FILENAME}...")
-# Скачиваем модель. Благодаря ENV HF_HOME в Dockerfile, она скачается в /app/cache
 try:
     model_path = hf_hub_download(
         repo_id=REPO_ID,
         filename=FILENAME
     )
-    print(f"System: Модель готова по пути {model_path}")
 except Exception as e:
-    print(f"CRITICAL ERROR: Не удалось скачать модель. {e}")
     raise e
 # --- ИНИЦИАЛИЗАЦИЯ LLM ---
 print("System: Запуск нейросети в память...")
 llm = Llama(
     model_path=model_path,
-    n_ctx=8192,        # Большой контекст
-    n_threads=4,       # На HF Spaces обычно 2-4 vCPU
-    verbose=False      # Меньше мусора в логах
 )
 print("System: Apex Engine готов к работе.")
@@ -54,7 +55,6 @@ def home():
 @app.post("/analyze")
 def analyze(req: AnalysisRequest):
-    # Строгий системный промпт для умных ответов
     prompt = f"""<|im_start|>system
 Ты — Apex, передовой аналитический ИИ.
 Твоя задача: проанализировать контекст и дать подробный, логичный и обоснованный ответ на русском языке.

 from fastapi.middleware.cors import CORSMiddleware
 import os
+# --- КОНФИГУРАЦИЯ МОДЕЛИ (ИСПРАВЛЕНО) ---
+# Используем репозиторий bartowski - это самый надежный источник GGUF
+REPO_ID = "bartowski/Qwen2.5-7B-Instruct-GGUF"
+# Точное имя файла (обрати внимание на большие буквы, это важно!)
+FILENAME = "Qwen2.5-7B-Instruct-Q4_K_M.gguf"
+print(f"System: Начинаю загрузку модели {FILENAME} из {REPO_ID}...")
 try:
     model_path = hf_hub_download(
         repo_id=REPO_ID,
         filename=FILENAME
     )
+    print(f"System: Модель успешно скачана: {model_path}")
 except Exception as e:
+    print(f"CRITICAL ERROR: Ошибка загрузки. Проверь интернет или имя файла. {e}")
     raise e
 # --- ИНИЦИАЛИЗАЦИЯ LLM ---
 print("System: Запуск нейросети в память...")
+# n_ctx=4096 - безопасное значение для HF Spaces (чтобы не вылетело по памяти)
 llm = Llama(
     model_path=model_path,
+    n_ctx=4096,
+    n_threads=4,
+    verbose=False
 )
 print("System: Apex Engine готов к работе.")
 @app.post("/analyze")
 def analyze(req: AnalysisRequest):
     prompt = f"""<|im_start|>system
 Ты — Apex, передовой аналитический ИИ.
 Твоя задача: проанализировать контекст и дать подробный, логичный и обоснованный ответ на русском языке.