Spaces:

dorangao
/

landify-chatbot-v2

Sleeping

anh-khoa-nguyen commited on Oct 9

Commit

559f582

1 Parent(s): 1bebe5b

change model

Files changed (3) hide show

app/services/intent_analyzer.py CHANGED Viewed

@@ -67,7 +67,7 @@ async def analyze_intent(user_query: str, max_retries: int = 3) -> IntentResult:
                         "content": prompt,
                     }
                 ],
-                model="gemma2-9b-it",  # Hoặc "mixtral-8x7b-32768"
                 temperature=0,  # =0 để kết quả có tính quyết định, ít sáng tạo
                 max_tokens=256,
                 response_format={"type": "json_object"},

                         "content": prompt,
                     }
                 ],
+                model="openai/gpt-oss-20b",  # Hoặc "mixtral-8x7b-32768"
                 temperature=0,  # =0 để kết quả có tính quyết định, ít sáng tạo
                 max_tokens=256,
                 response_format={"type": "json_object"},

app/services/response_synthesizer.py CHANGED Viewed

@@ -196,7 +196,7 @@ async def synthesize_response(context: ChatContext) -> str:
                     "content": prompt,
                 }
             ],
-            model="gemma2-9b-it",
             temperature=0.7,  # Cho phép LLM viết văn mượt mà hơn
             max_tokens=2048,
         )

                     "content": prompt,
                 }
             ],
+            model="openai/gpt-oss-20b",
             temperature=0.7,  # Cho phép LLM viết văn mượt mà hơn
             max_tokens=2048,
         )

app/tools/reranker_tools.py CHANGED Viewed

@@ -69,7 +69,7 @@ def choose_best_loandau_candidate(user_query: str, candidates: List[Dict[str, An
         logger.info("Gửi yêu cầu re-ranking đến LLM...")
         chat_completion = groq_client.chat.completions.create(
             messages=[{"role": "user", "content": prompt}],
-            model="gemma2-9b-it",
             temperature=0,
             response_format={"type": "json_object"},
         )

         logger.info("Gửi yêu cầu re-ranking đến LLM...")
         chat_completion = groq_client.chat.completions.create(
             messages=[{"role": "user", "content": prompt}],
+            model="openai/gpt-oss-20b",
             temperature=0,
             response_format={"type": "json_object"},
         )