Spaces:

levalencia
/

docling

Sleeping

App Files Files Community

docling / src /utils /cost_tracker.py

levalencia

Add reportlab dependency for PDF generation and enhance document processing

5d3ebd9 9 months ago

raw

history blame contribute delete

9.94 kB

	import logging
	from dataclasses import dataclass
	from typing import Dict, Optional
	from datetime import datetime

	logger = logging.getLogger(__name__)

	@dataclass
	class ModelPricing:
	"""Pricing information for Azure OpenAI models."""
	model_name: str
	input_cost_per_1k_tokens: float # Cost per 1000 input tokens
	output_cost_per_1k_tokens: float # Cost per 1000 output tokens
	description: str

	@dataclass
	class TokenUsage:
	"""Token usage statistics for a single API call."""
	prompt_tokens: int
	completion_tokens: int
	total_tokens: int
	model: str
	timestamp: datetime

	@dataclass
	class CostAnalysis:
	"""Cost analysis for document processing."""
	total_input_tokens: int
	total_output_tokens: int
	total_cost: float
	model_breakdown: Dict[str, Dict[str, float]] # {model: {"input_cost": x, "output_cost": y, "total_cost": z}}
	processing_time: float
	timestamp: datetime

	class CostTracker:
	"""Tracks token usage and calculates costs for Azure OpenAI API calls."""

	# Hardcoded pricing for Azure OpenAI models (current as of 2024)
	# Source: https://azure.microsoft.com/en-us/pricing/details/cognitive-services/openai-service/
	MODEL_PRICING = {
	# Standard model names
	"gpt-4o-mini": ModelPricing(
	model_name="gpt-4o-mini",
	input_cost_per_1k_tokens=0.00015, # $0.00015 per 1K input tokens
	output_cost_per_1k_tokens=0.0006, # $0.0006 per 1K output tokens
	description="GPT-4o Mini (O3 Mini)"
	),
	"gpt-4o": ModelPricing(
	model_name="gpt-4o",
	input_cost_per_1k_tokens=0.0025, # $0.0025 per 1K input tokens
	output_cost_per_1k_tokens=0.01, # $0.01 per 1K output tokens
	description="GPT-4o (O4)"
	),
	"gpt-35-turbo": ModelPricing(
	model_name="gpt-35-turbo",
	input_cost_per_1k_tokens=0.0005, # $0.0005 per 1K input tokens
	output_cost_per_1k_tokens=0.0015, # $0.0015 per 1K output tokens
	description="GPT-3.5 Turbo (O3)"
	),
	# Azure deployment names (custom names set in Azure)
	"o3-mini": ModelPricing(
	model_name="o3-mini",
	input_cost_per_1k_tokens=0.00015, # $0.00015 per 1K input tokens
	output_cost_per_1k_tokens=0.0006, # $0.0006 per 1K output tokens
	description="O3 Mini (GPT-4o Mini)"
	),
	"o4-mini": ModelPricing(
	model_name="o4-mini",
	input_cost_per_1k_tokens=0.00015, # $0.00015 per 1K input tokens
	output_cost_per_1k_tokens=0.0006, # $0.0006 per 1K output tokens
	description="O4 Mini (GPT-4o Mini)"
	),
	"o3": ModelPricing(
	model_name="o3",
	input_cost_per_1k_tokens=0.0005, # $0.0005 per 1K input tokens
	output_cost_per_1k_tokens=0.0015, # $0.0015 per 1K output tokens
	description="O3 (GPT-3.5 Turbo)"
	),
	"o4": ModelPricing(
	model_name="o4",
	input_cost_per_1k_tokens=0.0025, # $0.0025 per 1K input tokens
	output_cost_per_1k_tokens=0.01, # $0.01 per 1K output tokens
	description="O4 (GPT-4o)"
	),
	# Alternative model names that might be used in Azure deployments
	"gpt-4o-mini-2024-07-18": ModelPricing(
	model_name="gpt-4o-mini-2024-07-18",
	input_cost_per_1k_tokens=0.00015, # $0.00015 per 1K input tokens
	output_cost_per_1k_tokens=0.0006, # $0.0006 per 1K output tokens
	description="GPT-4o Mini (O3 Mini) - Latest"
	),
	"gpt-4o-2024-05-13": ModelPricing(
	model_name="gpt-4o-2024-05-13",
	input_cost_per_1k_tokens=0.0025, # $0.0025 per 1K input tokens
	output_cost_per_1k_tokens=0.01, # $0.01 per 1K output tokens
	description="GPT-4o (O4) - Latest"
	),
	"gpt-35-turbo-0125": ModelPricing(
	model_name="gpt-35-turbo-0125",
	input_cost_per_1k_tokens=0.0005, # $0.0005 per 1K input tokens
	output_cost_per_1k_tokens=0.0015, # $0.0015 per 1K output tokens
	description="GPT-3.5 Turbo (O3) - Latest"
	),
	}

	def __init__(self):
	self.usage_history: list[TokenUsage] = []
	self.current_session_tokens = 0
	self.current_session_cost = 0.0

	def record_usage(self, prompt_tokens: int, completion_tokens: int, model: str) -> TokenUsage:
	"""Record token usage from an API call."""
	total_tokens = prompt_tokens + completion_tokens
	usage = TokenUsage(
	prompt_tokens=prompt_tokens,
	completion_tokens=completion_tokens,
	total_tokens=total_tokens,
	model=model,
	timestamp=datetime.now()
	)

	self.usage_history.append(usage)
	self.current_session_tokens += total_tokens

	# Calculate cost for this usage
	cost = self._calculate_cost(prompt_tokens, completion_tokens, model)
	self.current_session_cost += cost

	logger.info(f"Recorded usage: {prompt_tokens} input + {completion_tokens} output = {total_tokens} total tokens "
	f"for model {model}, cost: ${cost:.6f}")

	return usage

	def _calculate_cost(self, input_tokens: int, output_tokens: int, model: str) -> float:
	"""Calculate cost for given token usage and model."""
	if model not in self.MODEL_PRICING:
	logger.warning(f"Unknown model pricing for {model}, using default pricing")
	# Try to guess the model type based on the name
	if "mini" in model.lower():
	# Assume it's a mini model (cheapest)
	model = "o3-mini"
	elif "o4" in model.lower():
	# Assume it's O4 (most expensive)
	model = "o4"
	elif "o3" in model.lower():
	# Assume it's O3 (medium)
	model = "o3"
	else:
	# Default to cheapest option
	model = "o3-mini"

	pricing = self.MODEL_PRICING[model]

	input_cost = (input_tokens / 1000) * pricing.input_cost_per_1k_tokens
	output_cost = (output_tokens / 1000) * pricing.output_cost_per_1k_tokens

	return input_cost + output_cost

	def get_session_summary(self) -> Dict[str, any]:
	"""Get summary of current session usage."""
	if not self.usage_history:
	return {
	"total_tokens": 0,
	"total_cost": 0.0,
	"model_breakdown": {},
	"usage_count": 0
	}

	model_breakdown = {}
	for usage in self.usage_history:
	if usage.model not in model_breakdown:
	model_breakdown[usage.model] = {
	"input_tokens": 0,
	"output_tokens": 0,
	"total_tokens": 0,
	"cost": 0.0,
	"usage_count": 0
	}

	model_breakdown[usage.model]["input_tokens"] += usage.prompt_tokens
	model_breakdown[usage.model]["output_tokens"] += usage.completion_tokens
	model_breakdown[usage.model]["total_tokens"] += usage.total_tokens
	model_breakdown[usage.model]["usage_count"] += 1
	model_breakdown[usage.model]["cost"] += self._calculate_cost(
	usage.prompt_tokens, usage.completion_tokens, usage.model
	)

	return {
	"total_tokens": self.current_session_tokens,
	"total_cost": self.current_session_cost,
	"model_breakdown": model_breakdown,
	"usage_count": len(self.usage_history)
	}

	def reset_session(self):
	"""Reset current session statistics."""
	self.usage_history = []
	self.current_session_tokens = 0
	self.current_session_cost = 0.0
	logger.info("Cost tracker session reset")

	def get_available_models(self) -> list[str]:
	"""Get list of available models with pricing."""
	return list(self.MODEL_PRICING.keys())

	def get_model_info(self, model: str) -> Optional[ModelPricing]:
	"""Get pricing information for a specific model."""
	return self.MODEL_PRICING.get(model)

	def add_deployment_pricing(self, deployment_name: str, model_type: str = "o3-mini"):
	"""Add pricing for a custom deployment name by mapping it to an existing model type."""
	if deployment_name in self.MODEL_PRICING:
	return # Already exists

	# Map deployment name to existing model pricing
	if model_type in self.MODEL_PRICING:
	base_pricing = self.MODEL_PRICING[model_type]
	self.MODEL_PRICING[deployment_name] = ModelPricing(
	model_name=deployment_name,
	input_cost_per_1k_tokens=base_pricing.input_cost_per_1k_tokens,
	output_cost_per_1k_tokens=base_pricing.output_cost_per_1k_tokens,
	description=f"{deployment_name} ({base_pricing.description})"
	)
	logger.info(f"Added pricing for deployment {deployment_name} based on {model_type}")
	else:
	logger.warning(f"Unknown model type {model_type} for deployment {deployment_name}")

	def guess_model_type(self, deployment_name: str) -> str:
	"""Guess the model type based on deployment name."""
	deployment_lower = deployment_name.lower()
	if "mini" in deployment_lower:
	return "o3-mini"
	elif "o4" in deployment_lower:
	return "o4"
	elif "o3" in deployment_lower:
	return "o3"
	else:
	return "o3-mini" # Default to cheapest

	# Global cost tracker instance
	cost_tracker = CostTracker()