Spaces:
Paused
Paused
Update backend_models.py
Browse files- backend_models.py +7 -4
backend_models.py
CHANGED
|
@@ -1,18 +1,21 @@
|
|
| 1 |
import os
|
| 2 |
import google.generativeai as genai
|
| 3 |
|
|
|
|
| 4 |
genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
|
| 5 |
|
|
|
|
| 6 |
def get_inference_client(model_id: str, provider: str = "auto"):
|
| 7 |
-
#
|
| 8 |
-
model_name = 'gemini-1.5-flash'
|
| 9 |
return genai.GenerativeModel(model_name)
|
| 10 |
|
| 11 |
-
|
| 12 |
def get_real_model_id(model_id: str) -> str:
|
|
|
|
|
|
|
| 13 |
return "gemini-1.5-flash"
|
| 14 |
|
| 15 |
-
#
|
| 16 |
def is_native_sdk_model(model_id: str) -> bool:
|
| 17 |
return True
|
| 18 |
|
|
|
|
| 1 |
import os
|
| 2 |
import google.generativeai as genai
|
| 3 |
|
| 4 |
+
# Cấu hình Gemini làm "xương sống" cho toàn hệ thống
|
| 5 |
genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
|
| 6 |
|
| 7 |
+
# Mapping: Bất kỳ model nào trên giao diện cũng sẽ trỏ về 1 trong 2 model của Google
|
| 8 |
def get_inference_client(model_id: str, provider: str = "auto"):
|
| 9 |
+
# Gemini 1.5 Flash là model cực nhanh, Flash-8B cực tiết kiệm
|
| 10 |
+
model_name = 'gemini-1.5-flash'
|
| 11 |
return genai.GenerativeModel(model_name)
|
| 12 |
|
|
|
|
| 13 |
def get_real_model_id(model_id: str) -> str:
|
| 14 |
+
# Ở đây ta "lừa" hệ thống: Dù frontend yêu cầu Kimi hay Qwen,
|
| 15 |
+
# ta vẫn trả về id của Gemini để backend không bị lỗi 404
|
| 16 |
return "gemini-1.5-flash"
|
| 17 |
|
| 18 |
+
# Giữ nguyên các hàm này để backend_api không báo lỗi thiếu thư viện
|
| 19 |
def is_native_sdk_model(model_id: str) -> bool:
|
| 20 |
return True
|
| 21 |
|