Spaces:
Paused
Paused
Update backend_api.py
Browse files- backend_api.py +9 -4
backend_api.py
CHANGED
|
@@ -90,13 +90,18 @@ _client_pool = {}
|
|
| 90 |
_client_pool_lock = threading.Lock()
|
| 91 |
|
| 92 |
def get_inference_client(model_id: str, provider: str = "auto"):
|
| 93 |
-
|
|
|
|
|
|
|
|
|
|
| 94 |
from openai import OpenAI
|
| 95 |
import os
|
| 96 |
|
| 97 |
return OpenAI(
|
| 98 |
base_url="https://api.groq.com/openai/v1",
|
| 99 |
-
api_key=os.getenv("GROQ_API_KEY")
|
|
|
|
|
|
|
| 100 |
)
|
| 101 |
|
| 102 |
# Define models and languages here to avoid importing Gradio UI
|
|
@@ -755,8 +760,8 @@ async def generate_code(request: CodeGenerationRequest, authorization: Optional[
|
|
| 755 |
{"role": "user", "content": query}
|
| 756 |
],
|
| 757 |
stream=True,
|
| 758 |
-
max_tokens=
|
| 759 |
-
temperature=0.
|
| 760 |
)
|
| 761 |
|
| 762 |
|
|
|
|
| 90 |
_client_pool_lock = threading.Lock()
|
| 91 |
|
| 92 |
def get_inference_client(model_id: str, provider: str = "auto"):
|
| 93 |
+
"""
|
| 94 |
+
Khởi tạo client với cấu hình timeout cao
|
| 95 |
+
để xử lý các phản hồi dài (code lớn)
|
| 96 |
+
"""
|
| 97 |
from openai import OpenAI
|
| 98 |
import os
|
| 99 |
|
| 100 |
return OpenAI(
|
| 101 |
base_url="https://api.groq.com/openai/v1",
|
| 102 |
+
api_key=os.getenv("GROQ_API_KEY"),
|
| 103 |
+
timeout=600.0, # Tăng thời gian chờ lên 10 phút
|
| 104 |
+
max_retries=3 # Tự động thử lại nếu kết nối bị rớt
|
| 105 |
)
|
| 106 |
|
| 107 |
# Define models and languages here to avoid importing Gradio UI
|
|
|
|
| 760 |
{"role": "user", "content": query}
|
| 761 |
],
|
| 762 |
stream=True,
|
| 763 |
+
max_tokens=32768, # Tăng giới hạn để code không bị cắt ngang
|
| 764 |
+
temperature=0.1 # Giảm nhiệt độ để code chính xác, ít "ảo tưởng" hơn
|
| 765 |
)
|
| 766 |
|
| 767 |
|