Spaces:

keerthanas1011
/

api-contract-debugger

Sleeping

keerthanas1011 commited on Apr 8

Commit

fbf25c0

verified ·

1 Parent(s): 51d8bce

Update inference.py

Files changed (1) hide show

inference.py CHANGED Viewed

@@ -233,13 +233,27 @@ def run_episode(client: OpenAI, task_name: str) -> None:
             if done:
                 break
-        score = env_score()
-        success = score >= 0.8
     finally:
         log_end(success=success, steps=steps_taken, score=score, rewards=rewards)
 # ---------------------------------------------------------------------------
 # Main
 # ---------------------------------------------------------------------------

             if done:
                 break
+        # Get the raw score from the environment (e.g., 0.0 or 1.0)
+        raw_score = env_score()
+        # Apply a small epsilon to keep the score strictly between (0, 1)
+        # 0.0 becomes 0.0001 and 1.0 becomes 0.9999
+        epsilon = 0.0001
+        score = max(epsilon, min(1.0 - epsilon, raw_score))
+        # Determine success using the original raw score logic
+        success = raw_score >= 0.8
+        # --- FIX ENDS HERE ---
+    except Exception as e:
+        print(f"[DEBUG] Episode failed: {e}", flush=True)
+        # Even on failure, ensure the final score is valid (not 0.0)
+        score = 0.0001
+        success = False
     finally:
         log_end(success=success, steps=steps_taken, score=score, rewards=rewards)
 # ---------------------------------------------------------------------------
 # Main
 # ---------------------------------------------------------------------------