Spaces:

Rid3
/

xtime-api

Sleeping

Rid3 commited on Mar 25

Commit

155bed5

verified ·

1 Parent(s): 470f516

Upload 2 files

Files changed (2) hide show

Dockerfile ADDED Viewed

+FROM python:3.10-slim
+# Ставим зависимости для скачивания и работы модели
+RUN apt-get update && apt-get install -y git && rm -rf /var/lib/apt/lists/*
+RUN useradd -m -u 1000 user
+USER user
+ENV PATH="/home/user/.local/bin:$PATH"
+WORKDIR /app
+# Устанавливаем библиотеку для работы с HF Hub и сервер
+RUN pip install --no-cache-dir huggingface_hub llama-cpp-python fastapi uvicorn
+# Копируем скрипт запуска (тот самый app.py, который мы обсуждали)
+COPY --chown=user app.py .
+# Если репозиторий ПРИВАТНЫЙ, нужно передать токен через переменную окружения в настройках Space
+# ENV HF_TOKEN=твой_токен
+EXPOSE 7860
+# Запускаем сервер
+CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

app.py ADDED Viewed

+from huggingface_hub import hf_hub_download
+def load_model(model_name: str):
+    # ... логика очистки памяти ...
+    # Скачиваем файл из твоего НОВОГО репозитория
+    model_path = hf_hub_download(
+        repo_id="Rid3/xtime-v1beta-gguf-storage",
+        filename=model_name
+    )
+    current_llm = Llama(model_path=model_path, n_ctx=2048)