import requests import logging import time import os LLM_ENDPOINT = "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent" def generate_answer(prompt: str) -> str: api_key = os.getenv("GEMINI_API_KEY") if not api_key: return "Thiếu biến môi trường GEMINI_API_KEY." max_retries = 3 timeout = 60 # Gemini Flash rất nhanh, timeout 1 phút là đủ payload = { "contents": [ { "parts": [ {"text": prompt} ] } ] } headers = {"Content-Type": "application/json"} url = f"{LLM_ENDPOINT}?key={api_key}" for attempt in range(1, max_retries + 1): try: logging.info(f"📡 Gửi request đến Gemini 2.5 Flash tại {LLM_ENDPOINT}") response = requests.post(url, json=payload, headers=headers, timeout=timeout) response.raise_for_status() data = response.json() # Lấy text trả về return data["candidates"][0]["content"]["parts"][0]["text"] except requests.exceptions.Timeout as e: logging.warning(f"⚠️ Timeout ở lần {attempt}: {e}") if attempt < max_retries: timeout *= 2 continue else: logging.error("❌ Lỗi timeout sau 3 lần retry.") return "Lỗi timeout khi gửi tới Gemini." except Exception as e: logging.warning(f"⚠️ Lỗi khi gửi request tới Gemini (lần {attempt}): {e}") if attempt < max_retries: time.sleep(1) continue else: logging.error("❌ Lỗi khi gửi tới Gemini sau 3 lần thử.") return "Lỗi khi gửi tới Gemini." return "Lỗi không xác định khi gửi tới Gemini."