Spaces:

Vivek16
/

ddd

Sleeping

App Files Files Community

Vivek16 commited on Feb 4

Commit

08487bc

verified ·

1 Parent(s): a6fa5c5

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -77

app.py CHANGED Viewed

@@ -11,8 +11,6 @@ import random
 MODEL = "gpt-4o-mini"
 API_URL = os.getenv("API_URL")
 if not API_URL:
     raise RuntimeError("API_URL not set in Hugging Face Secrets")
@@ -29,7 +27,6 @@ if not OPENAI_API_KEYS:
 NUM_THREADS = int(os.getenv("NUM_THREADS", "2"))
-# Safe debug logs (do NOT print actual keys)
 print("HF Space started")
 print("API_URL loaded")
 print("OPENAI_API_KEYS count:", len(OPENAI_API_KEYS))
@@ -46,7 +43,7 @@ sys.excepthook = exception_handler
 sys.tracebacklimit = 0
 # =====================================================
-# Prediction function
 # =====================================================
 def predict(inputs, top_p, temperature, chat_counter, chatbot, history, request: gr.Request):
@@ -55,91 +52,54 @@ def predict(inputs, top_p, temperature, chat_counter, chatbot, history, request:
     OPENAI_API_KEY = random.choice(OPENAI_API_KEYS)
-    headers_dict = {
-        key.decode("utf-8"): value.decode("utf-8")
-        for key, value in request.headers.raw
-    }
     headers = {
         "Content-Type": "application/json",
-        "Authorization": f"Bearer {OPENAI_API_KEY}",
-        "Headers": json.dumps(headers_dict),
     }
-    messages = []
-    if chat_counter != 0:
-        for i, data in enumerate(history):
-            role = "user" if i % 2 == 0 else "assistant"
-            messages.append({"role": role, "content": data})
-    messages.append({"role": "user", "content": inputs})
     payload = {
         "model": MODEL,
-        "messages": messages,
         "temperature": temperature,
-        "top_p": top_p,
-        "n": 1,
-        "stream": True,
-        "presence_penalty": 0,
-        "frequency_penalty": 0,
     }
     chat_counter += 1
     history.append(inputs)
-    partial_words = ""
-    token_counter = 0
-    counter = 0
     try:
-        response = requests.post(
-            API_URL,
-            headers=headers,
-            json=payload,
-            stream=True,
-            timeout=60,
         )
-        for chunk in response.iter_lines():
-            if counter == 0:
-                counter += 1
-                continue
-            if chunk:
-                decoded = chunk.decode()
-                if len(decoded) > 12:
-                    data = json.loads(decoded[6:])
-                    delta = data["choices"][0]["delta"]
-                    if "content" in delta:
-                        partial_words += delta["content"]
-                        if token_counter == 0:
-                            history.append(" " + partial_words)
-                        else:
-                            history[-1] = partial_words
-                        token_counter += 1
-                        yield (
-                            [(history[i], history[i + 1]) for i in range(0, len(history) - 1, 2)],
-                            history,
-                            chat_counter,
-                            response,
-                            gr.update(interactive=False),
-                            gr.update(interactive=False),
-                        )
     except Exception as e:
-        print(f"Streaming error: {e}")
-    yield (
-        [(history[i], history[i + 1]) for i in range(0, len(history) - 1, 2)],
-        history,
-        chat_counter,
-        response,
-        gr.update(interactive=True),
-        gr.update(interactive=True),
-    )
 # =====================================================
 # UI helpers
@@ -152,15 +112,13 @@ def reset_textbox():
 # Gradio UI
 # =====================================================
-title = """<h1 align="center">Hello welcome</h1>"""
 if DISABLED:
     title = """<h1 align="center" style="color:red">
     This app has reached its usage limit. Please check back later.
     </h1>"""
-description = """
-kutti.
-"""
 theme = gr.themes.Default(primary_hue="green")

 MODEL = "gpt-4o-mini"
 API_URL = os.getenv("API_URL")
 if not API_URL:
     raise RuntimeError("API_URL not set in Hugging Face Secrets")
 NUM_THREADS = int(os.getenv("NUM_THREADS", "2"))
 print("HF Space started")
 print("API_URL loaded")
 print("OPENAI_API_KEYS count:", len(OPENAI_API_KEYS))
 sys.tracebacklimit = 0
 # =====================================================
+# Prediction function (Responses API compatible)
 # =====================================================
 def predict(inputs, top_p, temperature, chat_counter, chatbot, history, request: gr.Request):
     OPENAI_API_KEY = random.choice(OPENAI_API_KEYS)
     headers = {
         "Content-Type": "application/json",
+        "Authorization": f"Bearer {OPENAI_API_KEY}"
     }
+    # Create payload for Responses API
     payload = {
         "model": MODEL,
+        "input": inputs,
         "temperature": temperature,
+        "top_p": top_p
     }
     chat_counter += 1
     history.append(inputs)
     try:
+        response = requests.post(API_URL, headers=headers, json=payload, timeout=60)
+        print("Status code:", response.status_code)
+        if response.status_code != 200:
+            print("Response text:", response.text)
+            output_text = f"Error: {response.status_code}"
+        else:
+            data = response.json()
+            # Extract text output from Responses API format
+            output_text = data["output"][0]["content"][0]["text"]
+            history.append(output_text)
+        yield (
+            [(history[i], history[i + 1]) for i in range(0, len(history) - 1, 2)],
+            history,
+            chat_counter,
+            response,
+            gr.update(interactive=True),
+            gr.update(interactive=True),
         )
     except Exception as e:
+        print(f"API request error: {e}")
+        yield (
+            [(history[i], history[i + 1]) for i in range(0, len(history) - 1, 2)],
+            history,
+            chat_counter,
+            None,
+            gr.update(interactive=True),
+            gr.update(interactive=True),
+        )
 # =====================================================
 # UI helpers
 # Gradio UI
 # =====================================================
+title = "<h1 align='center'>Hello welcome</h1>"
 if DISABLED:
     title = """<h1 align="center" style="color:red">
     This app has reached its usage limit. Please check back later.
     </h1>"""
+description = "kutti."
 theme = gr.themes.Default(primary_hue="green")