Spaces:

Amethyst-Labs
/

fst_api

Build error

StarrySkyWorld commited on Mar 3

Commit

4c12b60

verified ·

1 Parent(s): 0a694c3

Create Dockerfile

Files changed (1) hide show

Dockerfile ADDED Viewed

+# 使用专门针对推理优化的基础镜像 (如果使用 CPU 环境，请告知，我会替换为 llama-cpp 方案)
+FROM vllm/vllm-openai:latest
+# 设置工作目录
+WORKDIR /app
+# 设置环境变量
+# HF_HOME 用于存放模型缓存
+ENV HF_HOME=/data \
+    VLLM_CACHE=/data \
+    PORT=7860
+# 暴露端口 (HF Spaces 默认 7860)
+EXPOSE 7860
+# 极致速度优化参数说明：
+# --model: 模型路径
+# --max-model-len: 限制长度以节省显存/提升速度
+# --device: 指定设备 (auto/cpu/cuda)
+# --enforce-eager: 对于极小模型，强制 eager 模式有时比图捕获更快
+# --disable-log-requests: 减少日志 IO 开销
+ENTRYPOINT python3 -m vllm.entrypoints.openai.api_server \
+    --model HuggingFaceTB/SmolLM2-135M \
+    --max-model-len 2048 \
+    --port 7860 \
+    --host 0.0.0.0 \
+    --tensor-parallel-size 1 \
+    --disable-log-requests