AbuAlone09 commited on
Commit
d3d3936
·
verified ·
1 Parent(s): 4d12f5e

Update backend_api.py

Browse files
Files changed (1) hide show
  1. backend_api.py +9 -4
backend_api.py CHANGED
@@ -90,13 +90,18 @@ _client_pool = {}
90
  _client_pool_lock = threading.Lock()
91
 
92
  def get_inference_client(model_id: str, provider: str = "auto"):
93
- # Đảm bảo client này kết nối tới Groq thay vì OpenRouter
 
 
 
94
  from openai import OpenAI
95
  import os
96
 
97
  return OpenAI(
98
  base_url="https://api.groq.com/openai/v1",
99
- api_key=os.getenv("GROQ_API_KEY")
 
 
100
  )
101
 
102
  # Define models and languages here to avoid importing Gradio UI
@@ -755,8 +760,8 @@ async def generate_code(request: CodeGenerationRequest, authorization: Optional[
755
  {"role": "user", "content": query}
756
  ],
757
  stream=True,
758
- max_tokens=8192, # Tăng giới hạn để code không bị cắt ngang
759
- temperature=0.2 # Giảm nhiệt độ để code chính xác, ít "ảo tưởng" hơn
760
  )
761
 
762
 
 
90
  _client_pool_lock = threading.Lock()
91
 
92
  def get_inference_client(model_id: str, provider: str = "auto"):
93
+ """
94
+ Khởi tạo client với cấu hình timeout cao
95
+ để xử lý các phản hồi dài (code lớn)
96
+ """
97
  from openai import OpenAI
98
  import os
99
 
100
  return OpenAI(
101
  base_url="https://api.groq.com/openai/v1",
102
+ api_key=os.getenv("GROQ_API_KEY"),
103
+ timeout=600.0, # Tăng thời gian chờ lên 10 phút
104
+ max_retries=3 # Tự động thử lại nếu kết nối bị rớt
105
  )
106
 
107
  # Define models and languages here to avoid importing Gradio UI
 
760
  {"role": "user", "content": query}
761
  ],
762
  stream=True,
763
+ max_tokens=32768, # Tăng giới hạn để code không bị cắt ngang
764
+ temperature=0.1 # Giảm nhiệt độ để code chính xác, ít "ảo tưởng" hơn
765
  )
766
 
767