Spaces:

Suhasdev
/

Universal-prompt-Optimizer

Sleeping

App Files Files Community

Universal-prompt-Optimizer / src /gepa_optimizer /core /result.py

Suhasdev

Deploy Universal Prompt Optimizer to HF Spaces (clean)

cacd4d0 about 2 months ago

raw

history blame contribute delete

6.63 kB

	"""
	Result processing for GEPA Optimizer
	Handles extraction and processing of GEPA optimization results
	"""

	from typing import Any, Dict, Optional
	import logging

	logger = logging.getLogger(__name__)

	class ResultProcessor:
	"""
	Processes raw GEPA optimization results into clean, usable formats
	"""

	@staticmethod
	def extract_optimized_prompt(result: Any) -> str:
	"""
	Extract the optimized prompt from GEPA result object

	Args:
	result: Raw GEPA optimization result

	Returns:
	str: The optimized prompt text
	"""
	try:
	# Try multiple possible result structures
	if hasattr(result, 'best_candidate'):
	candidate = result.best_candidate

	if isinstance(candidate, dict):
	# Try common prompt keys
	for key in ['system_prompt', 'prompt', 'text']:
	if key in candidate:
	return str(candidate[key])

	# If no standard key found, return string representation
	return str(candidate)
	else:
	return str(candidate)

	# Fallback - convert entire result to string
	return str(result)

	except Exception as e:
	logger.warning(f"Failed to extract optimized prompt: {e}")
	return "Optimization completed (prompt extraction failed)"

	@staticmethod
	def extract_metrics(result: Any) -> Dict[str, Any]:
	"""
	Extract performance metrics from GEPA result

	Args:
	result: Raw GEPA optimization result

	Returns:
	Dict[str, Any]: Extracted metrics
	"""
	metrics = {}

	try:
	# Extract common metrics
	if hasattr(result, 'best_score'):
	metrics['best_score'] = float(result.best_score)

	if hasattr(result, 'baseline_score'):
	metrics['baseline_score'] = float(result.baseline_score)

	if hasattr(result, 'improvement'):
	metrics['improvement'] = float(result.improvement)

	if hasattr(result, 'iterations'):
	metrics['iterations'] = int(result.iterations)

	# Calculate improvement percentage if we have both scores
	if 'best_score' in metrics and 'baseline_score' in metrics:
	baseline = metrics['baseline_score']
	if baseline > 0:
	improvement_percent = ((metrics['best_score'] - baseline) / baseline) * 100
	metrics['improvement_percent'] = round(improvement_percent, 2)

	# Extract additional metadata
	if hasattr(result, 'metadata'):
	metrics['metadata'] = result.metadata

	except Exception as e:
	logger.warning(f"Failed to extract metrics: {e}")

	return metrics

	@staticmethod
	def extract_reflection_history(result: Any) -> list:
	"""
	Extract reflection/optimization history from GEPA result

	Args:
	result: Raw GEPA optimization result

	Returns:
	list: List of reflection iterations
	"""
	history = []

	try:
	if hasattr(result, 'optimization_history'):
	for i, iteration in enumerate(result.optimization_history):
	history_item = {
	'iteration': i,
	'score': iteration.get('score', 0.0),
	'candidate': iteration.get('candidate', {}),
	'feedback': iteration.get('feedback', ''),
	'improvement': iteration.get('improvement', 0.0)
	}
	history.append(history_item)

	except Exception as e:
	logger.warning(f"Failed to extract reflection history: {e}")

	return history

	@staticmethod
	def process_full_result(
	result: Any,
	original_prompt: str,
	optimization_time: float,
	actual_iterations: Optional[int] = None,
	test_metrics: Optional[Dict[str, Any]] = None
	) -> Dict[str, Any]:
	"""
	Process complete GEPA result into structured format.

	Args:
	result: Raw GEPA optimization result
	original_prompt: Original seed prompt
	optimization_time: Time taken for optimization
	actual_iterations: Actual number of iterations from GEPA logs (optional)
	test_metrics: Metrics from test set evaluation (optional)

	Returns:
	Dict[str, Any]: Complete processed result
	"""
	# Extract metrics first
	metrics = ResultProcessor.extract_metrics(result)

	# Extract iterations from GEPA result
	total_iterations = 0
	try:
	# First priority: use actual_iterations if provided (from logs)
	if actual_iterations is not None:
	total_iterations = actual_iterations
	elif hasattr(result, 'iterations'):
	total_iterations = int(result.iterations)
	elif hasattr(result, 'num_iterations'):
	total_iterations = int(result.num_iterations)
	elif hasattr(result, 'optimization_history'):
	total_iterations = len(result.optimization_history)
	# Check if it's in metrics
	elif 'iterations' in metrics:
	total_iterations = metrics['iterations']
	except Exception as e:
	logger.warning(f"Failed to extract iterations: {e}")

	# Merge test metrics into improvement_data
	improvement_data = {}
	if test_metrics:
	improvement_data.update(test_metrics)

	return {
	'original_prompt': original_prompt,
	'optimized_prompt': ResultProcessor.extract_optimized_prompt(result),
	'metrics': metrics,
	'improvement_data': improvement_data,
	'reflection_history': ResultProcessor.extract_reflection_history(result),
	'optimization_time': optimization_time,
	'total_iterations': total_iterations,
	'status': 'completed',
	'raw_result': result # Keep raw result for advanced users
	}