Spaces:

nicolaydef
/

Model

Sleeping

App Files Files Community

nicolaydef commited on Dec 15, 2025

Commit

cbc15c2

verified ·

1 Parent(s): 805eef5

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -41

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from pydantic import BaseModel
 from typing import List, Dict, Optional
 import uuid
-app = FastAPI(title="Gemini Proxy Server")
 # Хранилище сессий (в памяти)
 chat_sessions: Dict[str, List[dict]] = {}
@@ -16,11 +16,20 @@ class UserRequest(BaseModel):
 # Берем ключ из Secret Variables на Hugging Face
 API_KEY = os.getenv("GEMINI_API_KEY")
-GEMINI_URL = "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash-latest:generateContent"
 @app.get("/")
 def home():
-    return {"status": "running", "info": "Gemini Proxy for CLI is active"}
 @app.post("/newchat")
 def new_chat():
@@ -28,57 +37,75 @@ def new_chat():
     chat_sessions[new_id] = []
     return {"session_id": new_id, "message": "Новый чат создан."}
-@app.get("/chats")
-def list_chats():
-    return {"active_sessions": list(chat_sessions.keys())}
 @app.post("/chat")
 def chat(req: UserRequest):
     if not API_KEY:
-        raise HTTPException(status_code=500, detail="GEMINI_API_KEY не установлен в Secrets")
     sid = req.session_id
     if not sid or sid not in chat_sessions:
         sid = str(uuid.uuid4())[:8]
         chat_sessions[sid] = []
-    # Добавляем сообщение юзера
     user_msg_obj = {"role": "user", "parts": [{"text": req.message}]}
     chat_sessions[sid].append(user_msg_obj)
-    # Шлем историю в Gemini
     payload = {"contents": chat_sessions[sid]}
     headers = {"Content-Type": "application/json"}
-    try:
-        response = requests.post(
-            f"{GEMINI_URL}?key={API_KEY}",
-            json=payload,
-            headers=headers,
-            timeout=30
-        )
-        response.raise_for_status()
-        data = response.json()
-        # Парсим ответ
         try:
-            ai_text = data["candidates"][0]["content"]["parts"][0]["text"]
-        except (KeyError, IndexError):
-            # Если Gemini вернул блок по безопасности или пустой ответ
-            ai_text = "[Gemini не смог сгенерировать ответ (возможно, content filtering)]"
-        # Сохраняем ответ модели
-        ai_msg_obj = {"role": "model", "parts": [{"text": ai_text}]}
-        chat_sessions[sid].append(ai_msg_obj)
-        return {
-            "response": ai_text,
-            "session_id": sid
-        }
-    except requests.exceptions.RequestException as e:
-        chat_sessions[sid].pop() # Удаляем последнее сообщение при ошибке
-        raise HTTPException(status_code=502, detail=f"Google API Error: {str(e)}")
-    except Exception as e:
-        chat_sessions[sid].pop()
-        raise HTTPException(status_code=500, detail=f"Server Error: {str(e)}")

 from typing import List, Dict, Optional
 import uuid
+app = FastAPI(title="Gemini Multi-Model Proxy")
 # Хранилище сессий (в памяти)
 chat_sessions: Dict[str, List[dict]] = {}
 # Берем ключ из Secret Variables на Hugging Face
 API_KEY = os.getenv("GEMINI_API_KEY")
+# СПИСОК МОДЕЛЕЙ ДЛЯ ПЕРЕБОРА (от лучшей к худшей)
+MODELS_TO_TRY = [
+    "gemini-2.0-flash-exp",    # New 2.0 (Free tier available)
+    "gemini-1.5-flash",        # Current stable fast
+    "gemini-1.5-flash-latest", # Alias for latest flash
+    "gemini-1.5-flash-001",    # Fixed version
+    "gemini-1.5-pro",          # Pro version
+    "gemini-pro"               # Legacy 1.0
+]
 @app.get("/")
 def home():
+    return {"status": "running", "strategy": "failover_models"}
 @app.post("/newchat")
 def new_chat():
     chat_sessions[new_id] = []
     return {"session_id": new_id, "message": "Новый чат создан."}
 @app.post("/chat")
 def chat(req: UserRequest):
     if not API_KEY:
+        raise HTTPException(status_code=500, detail="GEMINI_API_KEY не установлен")
     sid = req.session_id
     if not sid or sid not in chat_sessions:
         sid = str(uuid.uuid4())[:8]
         chat_sessions[sid] = []
+    # 1. Сохраняем сообщение юзера
     user_msg_obj = {"role": "user", "parts": [{"text": req.message}]}
     chat_sessions[sid].append(user_msg_obj)
+    # 2. Пытаемся отправить запрос, перебирая модели
+    last_error = ""
+    success = False
+    ai_text = ""
+    used_model = ""
     payload = {"contents": chat_sessions[sid]}
     headers = {"Content-Type": "application/json"}
+    for model_name in MODELS_TO_TRY:
+        url = f"https://generativelanguage.googleapis.com/v1beta/models/{model_name}:generateContent?key={API_KEY}"
         try:
+            print(f"Trying model: {model_name}...") # Лог в консоль HF
+            response = requests.post(url, json=payload, headers=headers, timeout=30)
+            # Если 404 (модель не найдена) или 5xx (ошибка сервера) -> идем к следующей
+            if response.status_code != 200:
+                error_detail = response.text
+                print(f"Failed {model_name}: {response.status_code} - {error_detail}")
+                last_error = f"{response.status_code} on {model_name}"
+                continue # Пробуем следующую модель
+            # Если 200 OK
+            data = response.json()
+            try:
+                ai_text = data["candidates"][0]["content"]["parts"][0]["text"]
+                used_model = model_name
+                success = True
+                break # Выходим из цикла, успех!
+            except (KeyError, IndexError):
+                # Бывает, если сработал фильтр безопасности
+                ai_text = "[Gemini заблокировал ответ (Safety Filter)]"
+                success = True
+                break
+        except requests.exceptions.RequestException as e:
+            print(f"Connection error on {model_name}: {e}")
+            last_error = str(e)
+            continue
+    # 3. Обработка результата
+    if not success:
+        # Если перепробовали все модели и ничего не вышло
+        chat_sessions[sid].pop() # Удаляем вопрос юзера, чтобы не портить историю
+        raise HTTPException(status_code=502, detail=f"Все модели недоступны. Last error: {last_error}")
+    # 4. Сохраняем ответ (и дописываем, какая модель ответила, для дебага можно убрать)
+    # ai_text += f"\n\n_(model: {used_model})_"
+    ai_msg_obj = {"role": "model", "parts": [{"text": ai_text}]}
+    chat_sessions[sid].append(ai_msg_obj)
+    return {
+        "response": ai_text,
+        "session_id": sid,
+        "model_used": used_model
+    }