qwen2api

Sleeping

App Files Files Community

qwen2api / nginx.conf

wdawdwa

Deploy Qwen Local API to Hugging Face

9f2b1d2 3 months ago

raw

history blame contribute delete

2.28 kB

	# =================================================================
	# Qwen Local API - 终极粘性会话与性能版 Nginx 配置
	# 核心: 绝对信任后端，零干预，极致吞吐，并采用最健壮的会话保持策略
	# =================================================================

	# --- 全局性能设置 ---
	worker_processes auto;
	worker_rlimit_nofile 102400;

	# --- 事件模型优化 ---
	events {
	worker_connections 102400;
	use epoll;
	multi_accept on;
	}

	# --- HTTP 核心配置 ---
	http {
	# --- 基础性能优化 ---
	sendfile on;
	tcp_nopush on;
	tcp_nodelay on;
	keepalive_timeout 15s;
	client_body_timeout 10s;
	client_header_timeout 10s;
	server_tokens off;
	access_log off;


	# --- 上游服务器组 (我们的 AI 工人) ---
	upstream qwen_backend {
	# 关键修正 🚀: 使用更健壮的 hash 方法实现“终极粘性会话”
	# 我们不再依赖可能不稳定的客户端 IP，而是使用 Authorization 请求头进行哈希。
	# 因为来自同一个客户端的所有请求都包含相同的 API Key，这就像“人脸识别”，
	# 确保了100%的会话保持，从根本上杜绝流式输出的混乱问题。
	# `consistent` 关键字确保在工人数量变化时，尽可能少地重新映射会话。
	hash $http_authorization consistent;

	# 性能策略: 开启与工人的“VIP连接池”，实现极致连接复用
	keepalive 128;

	# 信任策略: 移除所有健康检查和熔断机制
	server qwen-local:8082;
	}


	# --- 主服务器配置 (API 网关) ---
	server {
	listen 80;

	location / {
	# 性能策略: 移除所有请求限流
	proxy_pass http://qwen_backend;

	# --- 流式传输终极优化 ---
	proxy_buffering off;
	proxy_cache off;

	# --- 协议与头信息设置 ---
	proxy_http_version 1.1;
	proxy_set_header Connection "";
	proxy_set_header Host $host;
	proxy_set_header X-Real-IP $remote_addr;
	proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
	proxy_set_header X-Forwarded-Proto $scheme;
	}
	}
	}