Spaces:

xidu
/

api1

Paused

App Files Files Community

xidu commited on Jun 28, 2025

Commit

58763e7

1 Parent(s): 0806587

deploy: Final attempt with user-provided code and google-genai

Browse files

Files changed (3) hide show

README.md +2 -1
app.py +438 -134
requirements.txt +1 -1

README.md CHANGED Viewed

@@ -10,4 +10,5 @@ This is a professional-grade FastAPI application that proxies requests to the Go
 - **`POST /v1/chat/completions`**: Main endpoint for chat, supports streaming.
 - **`GET /v1/models`**: Lists available models.
-- **`GET /`**: Health check.

 - **`POST /v1/chat/completions`**: Main endpoint for chat, supports streaming.
 - **`GET /v1/models`**: Lists available models.
+- **`GET /health`**: Health check.
+- **`GET /`**: API Info.

app.py CHANGED Viewed

@@ -3,18 +3,21 @@ import json
 import time
 import asyncio
 import os
-import random
 from contextlib import asynccontextmanager
-from typing import List
 import uvicorn
 from fastapi import FastAPI, Request, HTTPException
-from fastapi.responses import StreamingResponse, JSONResponse
 from fastapi.middleware.cors import CORSMiddleware
-# 正确的导入方式
-import google.generativeai as genai
-# 配置日志
 logging.basicConfig(
     level=logging.INFO,
     format='%(asctime)s [%(levelname)s]: %(message)s',
@@ -22,79 +25,114 @@ logging.basicConfig(
 )
 logger = logging.getLogger(__name__)
-# !!! 重要：管理您的 API 密钥 !!!
-# 为了安全，强烈建议您通过 Hugging Face Space 的 "Settings" -> "Secrets"
-# 来设置您的 API 密钥。例如，创建一个名为 "GOOGLE_API_KEYS" 的 Secret，
-# 它的值是 "key1,key2,key3"。
-# 然后使用下面这行代码来读取它们：
-# api_keys_str = os.environ.get("GOOGLE_API_KEYS", "")
-# API_KEYS = [key.strip() for key in api_keys_str.split(',') if key.strip()]
-# 为了方便首次测试，您可以先临时使用下面的列表：
-API_KEYS = [
-    "AIzaSyCJGYHjn3m41mYpft9j3G9-RXWkDAcAsPs", # 请替换成您的第一个有效密钥
-    "AIzaSyCoDA9F9bsCXJx9p1CQqdKpeSO4n31DPt0", # 请替换成您的第二个有效密钥
-]
 # 支持的模型列表
 SUPPORTED_MODELS = [
-    {"id": "gemini-1.5-flash-latest", "object": "model", "owned_by": "google"},
-    {"id": "gemini-pro", "object": "model", "owned_by": "google"},
 ]
 def get_model_name(requested_model: str) -> str:
-    if any(model['id'] == requested_model for model in SUPPORTED_MODELS):
-        return requested_model
-    return "gemini-1.5-flash-latest"
-def convert_messages_to_gemini_format(messages: List[dict]):
-    gemini_messages = []
     system_instruction = None
     for message in messages:
-        role = message.get("role")
-        content = message.get("content")
         if role == "system":
             system_instruction = content
-        elif role == "user":
-            gemini_messages.append({'role': 'user', 'parts': [{'text': content}]})
         elif role == "assistant":
-            gemini_messages.append({'role': 'model', 'parts': [{'text': content}]})
-    return gemini_messages, system_instruction
-def handle_error_response(error):
     error_str = str(error).lower()
-    if "api_key_invalid" in error_str:
-        return "提供的 API 密钥无效。", "invalid_request_error"
     if "prompt_feedback" in error_str:
-        return "请求因安全或内容策略被拒绝。", "content_filter"
-    return f"发生未知错误: {error}", "stop"
-def get_api_key():
-    if not API_KEYS or all("YOUR_GOOGLE_API_KEY" in key for key in API_KEYS):
-        raise ValueError("API 密钥列表为空或未配置。请在 app.py 中设置它们或使用 Space Secrets。")
-    return random.choice(API_KEYS)
 @asynccontextmanager
 async def lifespan(app: FastAPI):
-    logger.info("应用启动...")
     try:
-        if not API_KEYS or all("YOUR_GOOGLE_API_KEY" in key for key in API_KEYS):
-            logger.warning("警告：未检测到有效的 Google API 密钥。应用可能会在处理请求时失败。")
-        else:
-            # 启动时用一个密钥测试配置是否正确
-            genai.configure(api_key=API_KEYS[0])
-            logger.info(f"已加载 {len(API_KEYS)} 个 API 密钥，并成功配置。")
     except Exception as e:
-        logger.error(f"Gemini 配置失败: {e}")
-    yield
-    logger.info("应用关闭。")
-app = FastAPI(lifespan=lifespan, title="Gemini API Proxy", version="1.5.0")
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
@@ -103,102 +141,368 @@ app.add_middleware(
     allow_headers=["*"],
 )
-# 使用 genai.types 来访问类型定义
 SAFETY_SETTINGS = [
-    genai.types.SafetySetting(category=cat, threshold=genai.types.HarmBlockThreshold.BLOCK_NONE)
-    for cat in [
-        genai.types.HarmCategory.HARM_CATEGORY_HARASSMENT,
-        genai.types.HarmCategory.HARM_CATEGORY_HATE_SPEECH,
-        genai.types.HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT,
-        genai.types.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
-    ]
 ]
-async def stream_generator(model_name: str, gemini_messages, generation_config):
-    try:
-        genai.configure(api_key=get_api_key())
-        model = genai.GenerativeModel(model_name)
-        async for chunk in await model.generate_content_async(
-            contents=gemini_messages,
-            generation_config=generation_config,
-            stream=True
-        ):
-            if chunk.text:
-                data = {
-                    "id": f"chatcmpl-{int(time.time())}", "object": "chat.completion.chunk",
-                    "created": int(time.time()), "model": model_name,
-                    "choices": [{"delta": {"content": chunk.text}}],
-                }
-                yield f"data: {json.dumps(data, ensure_ascii=False)}\n\n"
-    except Exception as e:
-        logger.error(f"流式响应生成时出错: {e}")
-        error_message, finish_reason = handle_error_response(e)
-        error_data = {
-            "id": f"chatcmpl-{int(time.time())}", "object": "chat.completion.chunk",
-            "created": int(time.time()), "model": model_name,
-            "choices": [{"delta": {"content": error_message}, "finish_reason": finish_reason}],
-        }
-        yield f"data: {json.dumps(error_data, ensure_ascii=False)}\n\n"
-    finally:
-        final_data = {
-            "id": f"chatcmpl-{int(time.time())}", "object": "chat.completion.chunk",
-            "created": int(time.time()), "model": model_name,
-            "choices": [{"delta": {}, "finish_reason": "stop"}],
-        }
-        yield f"data: {json.dumps(final_data, ensure_ascii=False)}\n\n"
-        yield "data: [DONE]\n\n"
 @app.post("/v1/chat/completions")
 async def chat_completions(request: Request):
-    body = await request.json()
-    model_name = get_model_name(body.get("model", "gemini-1.5-flash-latest"))
-    messages = body.get("messages", [])
-    gemini_messages, system_instruction = convert_messages_to_gemini_format(messages)
-    generation_config = genai.types.GenerationConfig(
-        temperature=body.get("temperature", 0.7),
-        top_p=body.get("top_p", 1.0),
-        max_output_tokens=body.get("max_tokens", 8192),
-    )
-    if system_instruction:
-        generation_config.system_instruction = system_instruction
-    generation_config.safety_settings = SAFETY_SETTINGS
-    if body.get("stream", False):
-        return StreamingResponse(
-            stream_generator(model_name, gemini_messages, generation_config),
-            media_type="text/event-stream",
         )
-    else:
-        try:
-            genai.configure(api_key=get_api_key())
-            model = genai.GenerativeModel(model_name)
-            response = await model.generate_content_async(
-                contents=gemini_messages,
-                generation_config=generation_config
             )
             return {
-                "id": f"chatcmpl-{int(time.time())}", "object": "chat.completion",
-                "created": int(time.time()), "model": model_name,
-                "choices": [{"message": {"role": "assistant", "content": response.text}, "finish_reason": "stop"}],
-                "usage": {"prompt_tokens": 0, "completion_tokens": 0, "total_tokens": 0}
             }
         except Exception as e:
-            logger.error(f"非流式响应生成时出错: {e}")
-            error_message, _ = handle_error_response(e)
-            return JSONResponse(status_code=500, content={"error": {"message": error_message}})
 @app.get("/v1/models")
 async def list_models():
-    return {"object": "list", "data": SUPPORTED_MODELS}
 @app.get("/")
-def read_root():
-    return {"status": "ok", "message": "Gemini API Proxy is running."}

 import time
 import asyncio
 import os
+import traceback
+import sys
 from contextlib import asynccontextmanager
+import random
 import uvicorn
 from fastapi import FastAPI, Request, HTTPException
+from fastapi.responses import StreamingResponse
 from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import JSONResponse
+from google import genai
+from google.genai import types
+from typing import Optional, List, Dict, Any
+# 简化日志配置
 logging.basicConfig(
     level=logging.INFO,
     format='%(asctime)s [%(levelname)s]: %(message)s',
 )
 logger = logging.getLogger(__name__)
+# 模型配置
+GEMINI_MODELS = {
+    "gemini-2.0-flash-exp": "gemini-2.0-flash-exp",
+    "gemini-2.5-flash-preview-05-20": "gemini-2.5-flash-preview-05-20",
+    "gemini-2.5-flash": "gemini-2.5-flash",
+    "gemini-2.5-flash-preview-04-17": "gemini-2.5-flash-preview-04-17"
+}
 # 支持的模型列表
 SUPPORTED_MODELS = [
+    {
+        "id": "gemini-2.5-flash-preview-05-20",
+        "object": "model",
+        "created": int(time.time()),
+        "owned_by": "google",
+        "permission": [],
+        "root": "gemini-2.5-flash-preview-05-20",
+        "parent": None,
+        "description": "Gemini 2.5 Flash Preview - 最新实验性模型"
+    },
+    {
+        "id": "gemini-2.5-flash-preview-04-17",
+        "object": "model",
+        "created": int(time.time()),
+        "owned_by": "google",
+        "permission": [],
+        "root": "gemini-2.5-flash-preview-04-17",
+        "parent": None,
+        "description": "gemini-2.5-flash-preview-04-17- 经典专业模型"
+    },
+    {
+        "id": "gemini-2.5-flash",
+        "object": "model",
+        "created": int(time.time()),
+        "owned_by": "google",
+        "permission": [],
+        "root": "gemini-2.5-flash",
+        "parent": None,
+        "description": "gemini-2.5-flash稳定经典专业模型"
+    }
 ]
 def get_model_name(requested_model: str) -> str:
+    """获取实际的Gemini模型名称"""
+    return GEMINI_MODELS.get(requested_model, "gemini-2.5-flash")
+def convert_messages(messages):
+    content_parts = []
     system_instruction = None
     for message in messages:
+        role = message.get("role", "user")
+        content = message.get("content", "")
         if role == "system":
             system_instruction = content
         elif role == "assistant":
+            content_parts.append({
+                "role": "model",
+                "parts": [{"text": content}]
+            })
+        elif role == "user":
+            content_parts.append({
+                "role": "user",
+                "parts": [{"text": content}]
+            })
+    return content_parts, system_instruction
+def handle_error(error):
+    """简化的错误处理"""
     error_str = str(error).lower()
     if "prompt_feedback" in error_str:
+        if "other" in error_str:
+            return "您的输入内容可能过长或触发了安全策略。请尝试缩短您的问题。", "length"
+        elif "safety" in error_str:
+            return "您的请求被安全策略阻止。请尝��修改您的问题。", "content_filter"
+    elif "safety" in error_str:
+        return "您的请求被安全策略过滤。请尝试修改您的问题。", "content_filter"
+    return "生成内容时遇到错误。请稍后重试。", "stop"
 @asynccontextmanager
 async def lifespan(app: FastAPI):
     try:
+        setup_gemini()  # 测试API密钥是否有效
+        logger.info("应用启动完成")
+        yield
     except Exception as e:
+        logger.error(f"应用启动失败: {str(e)}")
+        raise
+    finally:
+        logger.info("应用关闭")
+# 创建FastAPI应用实例
+app = FastAPI(
+    lifespan=lifespan,
+    title="Gemini Official API",
+    version="1.3.0"
+)
+# 添加CORS中间件
 app.add_middleware(
     CORSMiddleware,
     allow_origins=["*"],
     allow_headers=["*"],
 )
+# API密钥列表
+API_KEYS = [
+    'AIzaSyCJGYHjn3m41mYpft9j3G9-RXWkDAcAsPs',
+     'AIzaSyCoDA9F9bsCXJx9p1CQqdKpeSO4n31DPt0'
+]
+# 当前使用的API密钥索引
+current_key_index = 0
+def get_random_api_key():
+    """获取随机API密钥"""
+    return random.choice(API_KEYS)
+def setup_gemini(api_key=None):
+    """配置Gemini API"""
+    if not api_key:
+        api_key = get_random_api_key()
+    if not API_KEYS:
+        logger.error("请设置有效的API密钥列表")
+        raise ValueError("API_KEYS未设置")
+    client = genai.Client(api_key=api_key)
+    return client, api_key
+# 配置安全设置
 SAFETY_SETTINGS = [
+    types.SafetySetting(
+        category=types.HarmCategory.HARM_CATEGORY_HARASSMENT,
+        threshold=types.HarmBlockThreshold.BLOCK_NONE,
+    ),
+    types.SafetySetting(
+        category=types.HarmCategory.HARM_CATEGORY_HATE_SPEECH,
+        threshold=types.HarmBlockThreshold.BLOCK_NONE,
+    ),
+    types.SafetySetting(
+        category=types.HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT,
+        threshold=types.HarmBlockThreshold.BLOCK_NONE,
+    ),
+    types.SafetySetting(
+        category=types.HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT,
+        threshold=types.HarmBlockThreshold.BLOCK_NONE,
+    ),
+    types.SafetySetting(
+        category=types.HarmCategory.HARM_CATEGORY_CIVIC_INTEGRITY,
+        threshold=types.HarmBlockThreshold.BLOCK_NONE,
+    ),
 ]
+async def try_generate_content(model_name, content_parts, config, max_retries=3):
+    """带重试机制的内容生成"""
+    last_error = None
+    used_keys = set()
+    for attempt in range(max_retries):
+        try:
+            # 获取新的API密钥（避免重复使用失败的密钥）
+            available_keys = [key for key in API_KEYS if key not in used_keys]
+            if not available_keys:
+                # 如果所有密钥都试过了，重置使用记录
+                used_keys.clear()
+                available_keys = API_KEYS
+            api_key = random.choice(available_keys)
+            used_keys.add(api_key)
+            client, current_key = setup_gemini(api_key)
+            logger.info(f"尝试第 {attempt + 1} 次，使用密钥: {current_key[:20]}...")
+            response = client.models.generate_content(
+                model=model_name,
+                contents=content_parts,
+                config=config
+            )
+            return response, current_key
+        except Exception as e:
+            last_error = e
+            error_str = str(e).lower()
+            # 检查是否是需要重试的错误
+            if any(code in error_str for code in ['400', '401', '403', '429', '500', '502', '503', '504']):
+                logger.warning(f"第 {attempt + 1} 次尝试失败: {str(e)}")
+                if attempt < max_retries - 1:
+                    await asyncio.sleep(1)  # 等待1秒后重试
+                    continue
+            else:
+                # 非网络错误，直接抛出
+                raise e
+    # 所有重试都失败了
+    raise last_error
 @app.post("/v1/chat/completions")
 async def chat_completions(request: Request):
+    """聊天对话接口"""
+    try:
+        body = await request.json()
+        messages = body.get('messages', [])
+        stream = body.get('stream', False)
+        max_tokens = body.get('max_tokens', 65536)
+        temperature = body.get('temperature', 1.2)
+        top_p = body.get('top_p', 0.0)
+        requested_model = body.get('model', 'gemini-2.5-flash')
+        model_name = get_model_name(requested_model)
+        content_parts, system_instruction = convert_messages(messages)
+        config = types.GenerateContentConfig(
+            max_output_tokens=max_tokens,
+            temperature=temperature,
+            top_p=top_p,
+            system_instruction=system_instruction,
+            safety_settings=SAFETY_SETTINGS,
         )
+        if stream:
+            # 流式响应也需要重试机制
+            client, api_key = setup_gemini()
+            return StreamingResponse(
+                stream_response_with_retry(client, model_name, content_parts, config),
+                media_type='text/event-stream'
             )
+        else:
+            response, used_key = await try_generate_content(model_name, content_parts, config)
+            response_text = response.text if response else ""
+            finish_reason = "stop"
+            if not response_text:
+                response_text = "无法生成回复。请尝试修改您的问题。"
+            logger.info(f"成功生成回复，使用密钥: {used_key[:20]}...")
             return {
+                'id': f'chatcmpl-{int(time.time())}-{random.randint(1000, 9999)}',
+                'object': 'chat.completion',
+                'created': int(time.time()),
+                'model': requested_model,
+                'choices': [{
+                    'index': 0,
+                    'message': {
+                        'role': 'assistant',
+                        'content': response_text
+                    },
+                    'finish_reason': finish_reason
+                }],
+                'usage': {
+                    'prompt_tokens': len(content_parts),
+                    'completion_tokens': len(response_text.split()),
+                    'total_tokens': len(content_parts) + len(response_text.split())
+                }
+            }
+    except Exception as e:
+        logger.error(f"处理聊天请求出错: {str(e)}")
+        error_message, finish_reason = handle_error(e)
+        raise HTTPException(status_code=500, detail=str(e))
+async def stream_response_with_retry(client, model_name, content_parts, config, max_retries=3):
+    """带重试机制的流式响应生成器"""
+    last_error = None
+    used_keys = set()
+    for attempt in range(max_retries):
+        try:
+            # 获取新的API密钥（避免重复使用失败的密钥）
+            available_keys = [key for key in API_KEYS if key not in used_keys]
+            if not available_keys:
+                used_keys.clear()
+                available_keys = API_KEYS
+            api_key = random.choice(available_keys)
+            used_keys.add(api_key)
+            current_client, current_key = setup_gemini(api_key)
+            logger.info(f"流式响应尝试第 {attempt + 1} 次，使用密钥: {current_key[:20]}...")
+            for chunk in current_client.models.generate_content_stream(
+                    model=model_name,
+                    contents=content_parts,
+                    config=config
+            ):
+                # 确保chunk存在且有文本内容
+                if chunk and hasattr(chunk, 'text') and chunk.text:
+                    data = {
+                        'id': f'chatcmpl-{int(time.time())}-{random.randint(1000, 9999)}',
+                        'object': 'chat.completion.chunk',
+                        'created': int(time.time()),
+                        'model': model_name,
+                        'choices': [{
+                            'index': 0,
+                            'delta': {
+                                'role': 'assistant',
+                                'content': chunk.text
+                            },
+                            'finish_reason': None
+                        }]
+                    }
+                    yield f'data: {json.dumps(data, ensure_ascii=False)}\n\n'
+                    await asyncio.sleep(0.01)
+            # 发送结束标记
+            final_data = {
+                'id': f'chatcmpl-{int(time.time())}-{random.randint(1000, 9999)}',
+                'object': 'chat.completion.chunk',
+                'created': int(time.time()),
+                'model': model_name,
+                'choices': [{
+                    'index': 0,
+                    'delta': {},
+                    'finish_reason': 'stop'
+                }]
             }
+            yield f'data: {json.dumps(final_data, ensure_ascii=False)}\n\n'
+            yield 'data: [DONE]\n\n'
+            logger.info(f"流式响应成功，使用密钥: {current_key[:20]}...")
+            return  # 成功完成，退出重试循环
         except Exception as e:
+            last_error = e
+            error_str = str(e).lower()
+            # 检查是否是需要重试的错误
+            if any(code in error_str for code in ['400', '401', '403', '429', '500', '502', '503', '504']):
+                logger.warning(f"流式响应第 {attempt + 1} 次尝试失败: {str(e)}")
+                if attempt < max_retries - 1:
+                    await asyncio.sleep(1)
+                    continue
+            else:
+                # 非网络错误，直接处理
+                break
+    # 所有重试都失败了，返回错误信息
+    logger.error(f"流式响应所有重试失败: {str(last_error)}")
+    error_message, finish_reason = handle_error(last_error)
+    error_data = {
+        'id': f'chatcmpl-{int(time.time())}-error',
+        'object': 'chat.completion.chunk',
+        'created': int(time.time()),
+        'model': model_name,
+        'choices': [{
+            'index': 0,
+            'delta': {
+                'role': 'assistant',
+                'content': error_message
+            },
+            'finish_reason': finish_reason
+        }]
+    }
+    yield f'data: {json.dumps(error_data, ensure_ascii=False)}\n\n'
+    yield 'data: [DONE]\n\n'
 @app.get("/v1/models")
 async def list_models():
+    """获取可用模型列表"""
+    try:
+        return {
+            "object": "list",
+            "data": SUPPORTED_MODELS
+        }
+    except Exception as e:
+        logger.error(f"获取模型列表出错: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/v1/models/{model_id}")
+async def get_model_info(model_id: str):
+    """获取特定模型信息"""
+    try:
+        for model in SUPPORTED_MODELS:
+            if model["id"] == model_id:
+                return model
+        raise HTTPException(status_code=404, detail=f"模型 {model_id} 未找到")
+    except HTTPException:
+        raise
+    except Exception as e:
+        logger.error(f"获取模型信息出错: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/v1/chat/completions/v1/models")
+async def list_models_alternative():
+    """获取可用模型列表 - 兼容路径"""
+    try:
+        return {
+            "object": "list",
+            "data": SUPPORTED_MODELS
+        }
+    except Exception as e:
+        logger.error(f"获取模型列表出错: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))
+@app.get("/health")
+async def health_check():
+    """健康检查端点"""
+    try:
+        return {
+            "status": "healthy",
+            "timestamp": int(time.time()),
+            "api": "gemini-official",
+            "available_models": [model["id"] for model in SUPPORTED_MODELS],
+            "version": "1.3.0"
+        }
+    except Exception as e:
+        logger.error(f"健康检查失败: {str(e)}")
+        return {
+            "status": "unhealthy",
+            "timestamp": int(time.time()),
+            "error": str(e)
+        }
 @app.get("/")
+async def root():
+    """根路径信息"""
+    return {
+        "name": "Gemini Official API",
+        "version": "1.3.0",
+        "description": "Google Gemini官方API接口服务",
+        "endpoints": {
+            "models": "/v1/models",
+            "models_alt": "/v1/chat/completions/v1/models",
+            "chat": "/v1/chat/completions",
+            "health": "/health"
+        }
+    }
+@app.exception_handler(404)
+async def not_found_handler(request: Request, exc: HTTPException):
+    """处理404错误"""
+    return {
+        "error": "未找到",
+        "requested_path": str(request.url.path),
+        "message": "请求的路径不存在",
+        "available_endpoints": {
+            "models": "/v1/models",
+            "models_alt": "/v1/chat/completions/v1/models",
+            "chat": "/v1/chat/completions",
+            "health": "/health",
+            "info": "/"
+        }
+    }
+if __name__ == "__main__":
+    print("🚀 启动Gemini官方API服务器")
+    print(f"📊 支持的模型: {[model['id'] for model in SUPPORTED_MODELS]}")
+    print(f"🔑 已配置 {len(API_KEYS)} 个API密钥")
+    print("🔄 支持自动重试和密钥轮换")
+    uvicorn.run(app, host="0.0.0.0", port=7860)

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
 fastapi
 uvicorn
-google-genai==1.20.0
 loguru
 httpx

 fastapi
 uvicorn
+google-genai
 loguru
 httpx