# =================================================================
# Qwen Local API - 终极粘性会话与性能版 Nginx 配置
# 核心: 绝对信任后端，零干预，极致吞吐，并采用最健壮的会话保持策略
# =================================================================

# --- 全局性能设置 ---
worker_processes auto;
worker_rlimit_nofile 102400;

# --- 事件模型优化 ---
events {
    worker_connections 102400;
    use epoll;
    multi_accept on;
}

# --- HTTP 核心配置 ---
http {
    # --- 基础性能优化 ---
    sendfile on;
    tcp_nopush on;
    tcp_nodelay on;
    keepalive_timeout 15s;
    client_body_timeout 10s;
    client_header_timeout 10s;
    server_tokens off;
    access_log off;


    # --- 上游服务器组 (我们的 AI 工人) ---
    upstream qwen_backend {
        # 关键修正 🚀: 使用更健壮的 hash 方法实现“终极粘性会话”
        # 我们不再依赖可能不稳定的客户端 IP，而是使用 Authorization 请求头进行哈希。
        # 因为来自同一个客户端的所有请求都包含相同的 API Key，这就像“人脸识别”，
        # 确保了100%的会话保持，从根本上杜绝流式输出的混乱问题。
        # `consistent` 关键字确保在工人数量变化时，尽可能少地重新映射会话。
        hash $http_authorization consistent;

        # 性能策略: 开启与工人的“VIP连接池”，实现极致连接复用
        keepalive 128;

        # 信任策略: 移除所有健康检查和熔断机制
        server qwen-local:8082;
    }


    # --- 主服务器配置 (API 网关) ---
    server {
        listen 80;

        location / {
            # 性能策略: 移除所有请求限流
            proxy_pass http://qwen_backend;

            # --- 流式传输终极优化 ---
            proxy_buffering off;
            proxy_cache off;

            # --- 协议与头信息设置 ---
            proxy_http_version 1.1;
            proxy_set_header Connection "";
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
            proxy_set_header X-Forwarded-Proto $scheme;
        }
    }
}