Spaces:

ZENLLC
/

RAGmod4

Sleeping

ZENLLC commited on Nov 11, 2025

Commit

d223e34

verified ·

1 Parent(s): a4a5726

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,8 @@ from openai import OpenAI
 # -------------------- CONFIG --------------------
 CHAT_MODEL = "gpt-5"  # main chat model
-EMBED_MODEL = "text-embedding-3-large"
 DEFAULT_SYSTEM_PROMPT = """You are a Retrieval-Augmented Generation (RAG) assistant.
@@ -327,13 +328,12 @@ def chat_with_rag(
     # Current user message
     messages.append({"role": "user", "content": user_message})
-    # Call OpenAI GPT-5 using max_completion_tokens
     try:
         resp = client.chat.completions.create(
             model=CHAT_MODEL,
             messages=messages,
-            temperature=0.3,
-            max_completion_tokens=900,  # correct param for GPT-5
         )
         answer = resp.choices[0].message.content
     except Exception as e:

 # -------------------- CONFIG --------------------
 CHAT_MODEL = "gpt-5"  # main chat model
+# Use a model your project actually has access to
+EMBED_MODEL = "text-embedding-3-small"
 DEFAULT_SYSTEM_PROMPT = """You are a Retrieval-Augmented Generation (RAG) assistant.
     # Current user message
     messages.append({"role": "user", "content": user_message})
+    # Call OpenAI GPT-5 using max_completion_tokens ONLY (no temperature)
     try:
         resp = client.chat.completions.create(
             model=CHAT_MODEL,
             messages=messages,
+            max_completion_tokens=900,  # GPT-5-compatible param
         )
         answer = resp.choices[0].message.content
     except Exception as e: