qwen2api / nginx.conf
wdawdwa's picture
Deploy Qwen Local API to Hugging Face
9f2b1d2
# =================================================================
# Qwen Local API - 终极粘性会话与性能版 Nginx 配置
# 核心: 绝对信任后端,零干预,极致吞吐,并采用最健壮的会话保持策略
# =================================================================
# --- 全局性能设置 ---
worker_processes auto;
worker_rlimit_nofile 102400;
# --- 事件模型优化 ---
events {
worker_connections 102400;
use epoll;
multi_accept on;
}
# --- HTTP 核心配置 ---
http {
# --- 基础性能优化 ---
sendfile on;
tcp_nopush on;
tcp_nodelay on;
keepalive_timeout 15s;
client_body_timeout 10s;
client_header_timeout 10s;
server_tokens off;
access_log off;
# --- 上游服务器组 (我们的 AI 工人) ---
upstream qwen_backend {
# 关键修正 🚀: 使用更健壮的 hash 方法实现“终极粘性会话”
# 我们不再依赖可能不稳定的客户端 IP,而是使用 Authorization 请求头进行哈希。
# 因为来自同一个客户端的所有请求都包含相同的 API Key,这就像“人脸识别”,
# 确保了100%的会话保持,从根本上杜绝流式输出的混乱问题。
# `consistent` 关键字确保在工人数量变化时,尽可能少地重新映射会话。
hash $http_authorization consistent;
# 性能策略: 开启与工人的“VIP连接池”,实现极致连接复用
keepalive 128;
# 信任策略: 移除所有健康检查和熔断机制
server qwen-local:8082;
}
# --- 主服务器配置 (API 网关) ---
server {
listen 80;
location / {
# 性能策略: 移除所有请求限流
proxy_pass http://qwen_backend;
# --- 流式传输终极优化 ---
proxy_buffering off;
proxy_cache off;
# --- 协议与头信息设置 ---
proxy_http_version 1.1;
proxy_set_header Connection "";
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
}
}
}