Spaces:

Sushruth21
/

energy-optimization-space

Sleeping

App Files Files Community

Sushruth21 commited on 4 days ago

Commit

cca44f4

1 Parent(s): 4aa36f3

fix: clamp grader scores strictly between 0 and 1 for validator compliance

Browse files

Files changed (2) hide show

inference.py +10 -5
task_graders.py +19 -8

inference.py CHANGED Viewed

@@ -54,7 +54,8 @@ def task_1_basic_ram_reduction_grader(observation: EnergyOptimizationObservation
         step_efficiency = max(0.0, 1.0 - (observation.steps_taken - max_steps) * 0.1)
     composite_score = (ram_score * 0.4) + (energy_score * 0.4) + (step_efficiency * 0.2)
-    return round(composite_score, 3)
 def task_2_energy_optimization_grader(observation: EnergyOptimizationObservation) -> float:
@@ -78,7 +79,8 @@ def task_2_energy_optimization_grader(observation: EnergyOptimizationObservation
         step_efficiency = max(0.0, 1.0 - (observation.steps_taken - max_steps) * 0.08)
     composite_score = (energy_score * 0.5) + (ram_constraint_score * 0.25) + (step_efficiency * 0.25)
-    return round(composite_score, 3)
 def task_3_balanced_optimization_grader(observation: EnergyOptimizationObservation) -> float:
@@ -101,7 +103,8 @@ def task_3_balanced_optimization_grader(observation: EnergyOptimizationObservati
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 def task_4_advanced_efficiency_grader(observation: EnergyOptimizationObservation) -> float:
@@ -124,7 +127,8 @@ def task_4_advanced_efficiency_grader(observation: EnergyOptimizationObservation
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 def task_5_expert_optimization_grader(observation: EnergyOptimizationObservation) -> float:
@@ -147,7 +151,8 @@ def task_5_expert_optimization_grader(observation: EnergyOptimizationObservation
         step_bonus = max(-0.3, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 # Explicit task grader mapping for validator tool detection

         step_efficiency = max(0.0, 1.0 - (observation.steps_taken - max_steps) * 0.1)
     composite_score = (ram_score * 0.4) + (energy_score * 0.4) + (step_efficiency * 0.2)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 def task_2_energy_optimization_grader(observation: EnergyOptimizationObservation) -> float:
         step_efficiency = max(0.0, 1.0 - (observation.steps_taken - max_steps) * 0.08)
     composite_score = (energy_score * 0.5) + (ram_constraint_score * 0.25) + (step_efficiency * 0.25)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 def task_3_balanced_optimization_grader(observation: EnergyOptimizationObservation) -> float:
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 def task_4_advanced_efficiency_grader(observation: EnergyOptimizationObservation) -> float:
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 def task_5_expert_optimization_grader(observation: EnergyOptimizationObservation) -> float:
         step_bonus = max(-0.3, -(observation.steps_taken - max_steps) * 0.05)
     composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # Explicit task grader mapping for validator tool detection

task_graders.py CHANGED Viewed

@@ -72,7 +72,10 @@ def task_1_basic_ram_reduction_grader(observation: EnergyOptimizationObservation
     # Combined score: 40% RAM, 40% Energy, 20% Step Efficiency
     composite_score = (ram_score * 0.4) + (energy_score * 0.4) + (step_efficiency * 0.2)
-    return round(composite_score, 3)
 # ============================================================================
@@ -129,7 +132,9 @@ def task_2_energy_optimization_grader(observation: EnergyOptimizationObservation
     # Combined: Energy (50%), RAM Constraint (25%), Step Efficiency (25%)
     composite_score = (energy_score * 0.5) + (ram_constraint_score * 0.25) + (step_efficiency * 0.25)
-    return round(composite_score, 3)
 # ============================================================================
@@ -181,9 +186,11 @@ def task_3_balanced_optimization_grader(observation: EnergyOptimizationObservati
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)  # Up to -20% penalty
     # Combined: Balance (90%) + Step Bonus (10%)
-    composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 # ============================================================================
@@ -213,9 +220,11 @@ def task_4_advanced_efficiency_grader(observation: EnergyOptimizationObservation
     else:
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
-    composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 # ============================================================================
@@ -245,9 +254,11 @@ def task_5_expert_optimization_grader(observation: EnergyOptimizationObservation
     else:
         step_bonus = max(-0.3, -(observation.steps_taken - max_steps) * 0.05)
-    composite_score = max(0.0, min(1.0, (balance_score * 0.9) + step_bonus))
-    return round(composite_score, 3)
 # ============================================================================

     # Combined score: 40% RAM, 40% Energy, 20% Step Efficiency
     composite_score = (ram_score * 0.4) + (energy_score * 0.4) + (step_efficiency * 0.2)
+    # Clamp strictly between 0 and 1 (not including endpoints)
+    # Validator requires 0 < score < 1
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # ============================================================================
     # Combined: Energy (50%), RAM Constraint (25%), Step Efficiency (25%)
     composite_score = (energy_score * 0.5) + (ram_constraint_score * 0.25) + (step_efficiency * 0.25)
+    # Clamp strictly between 0 and 1 (not including endpoints)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # ============================================================================
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)  # Up to -20% penalty
     # Combined: Balance (90%) + Step Bonus (10%)
+    composite_score = (balance_score * 0.9) + step_bonus
+    # Clamp strictly between 0 and 1 (not including endpoints)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # ============================================================================
     else:
         step_bonus = max(-0.2, -(observation.steps_taken - max_steps) * 0.05)
+    composite_score = (balance_score * 0.9) + step_bonus
+    # Clamp strictly between 0 and 1 (not including endpoints)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # ============================================================================
     else:
         step_bonus = max(-0.3, -(observation.steps_taken - max_steps) * 0.05)
+    composite_score = (balance_score * 0.9) + step_bonus
+    # Clamp strictly between 0 and 1 (not including endpoints)
+    clamped_score = max(0.001, min(0.999, composite_score))
+    return round(clamped_score, 3)
 # ============================================================================