Spaces:

smolagents
/

ml-intern

Running on CPU Upgrade

App Files Files Community

ml-intern / tests /unit /test_usage.py

lewtun HF Staff

Instrument dataset usage and billing analytics (#316)

4ecc3bd unverified 22 days ago

Raw

History Blame Contribute Delete

33.1 kB

	from datetime import UTC, datetime
	import sys
	from pathlib import Path
	from types import SimpleNamespace

	import pytest

	_BACKEND_DIR = Path(__file__).resolve().parent.parent.parent / "backend"
	if str(_BACKEND_DIR) not in sys.path:
	sys.path.insert(0, str(_BACKEND_DIR))

	from usage import ( # noqa: E402
	USAGE_EVENT_TYPES,
	_account_bucket_from_billing_usage,
	_session_bucket_from_inference_session_usage,
	aggregate_usage_events,
	build_hf_billing_snapshot,
	build_usage_response,
	resolve_usage_windows,
	)
	from agent.core import session_persistence # noqa: E402
	from agent.core.usage_metrics import ( # noqa: E402
	summarize_usage_events,
	usage_metric_scalar_fields,
	)

	BILLING_SESSION_ID = "00000000-0000-4000-8000-000000000001"


	def _event(event_type, data=None, created_at="2026-06-01T12:00:00+00:00"):
	return {
	"event_type": event_type,
	"data": data or {},
	"timestamp": created_at,
	}


	def test_aggregate_usage_events_sums_inference_jobs_and_sandboxes():
	events = [
	_event(
	"llm_call",
	{
	"cost_usd": 0.125,
	"prompt_tokens": 100,
	"completion_tokens": 50,
	"cache_read_tokens": 25,
	"cache_creation_tokens": 5,
	"total_tokens": 180,
	},
	),
	_event("llm_call", {"cost_usd": 0.25, "prompt_tokens": 10}),
	_event(
	"hf_job_complete",
	{
	"estimated_cost_usd": 1.5,
	"billable_seconds_estimate": 1800,
	},
	),
	_event(
	"sandbox_create",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"hardware": "cpu-upgrade",
	},
	created_at="2026-06-01T12:30:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"lifetime_s": 3600,
	},
	created_at="2026-06-01T13:30:00+00:00",
	),
	]

	usage = aggregate_usage_events(events, session_id="s1")

	assert usage["session_id"] == "s1"
	assert usage["llm_calls"] == 2
	assert usage["hf_jobs_count"] == 1
	assert usage["sandbox_count"] == 1
	assert usage["prompt_tokens"] == 110
	assert usage["completion_tokens"] == 50
	assert usage["cache_read_tokens"] == 25
	assert usage["cache_creation_tokens"] == 5
	assert usage["total_tokens"] == 190
	assert usage["hf_jobs_billable_seconds_estimate"] == 1800
	assert usage["sandbox_billable_seconds_estimate"] == 3600
	assert usage["inference_usd"] == 0.375
	assert usage["hf_jobs_estimated_usd"] == 1.5
	assert usage["sandbox_estimated_usd"] == 0.05
	assert usage["total_usd"] == 1.925


	def test_aggregate_usage_events_treats_missing_costs_as_zero():
	usage = aggregate_usage_events(
	[
	_event("llm_call", {"prompt_tokens": 7}),
	_event("hf_job_complete", {"wall_time_s": 60}),
	]
	)

	assert usage["llm_calls"] == 1
	assert usage["hf_jobs_count"] == 1
	assert usage["prompt_tokens"] == 7
	assert usage["hf_jobs_billable_seconds_estimate"] == 60
	assert usage["total_usd"] == 0.0


	def test_aggregate_usage_events_ignores_active_sandbox_before_destroy():
	usage = aggregate_usage_events(
	[
	_event(
	"sandbox_create",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"hardware": "a100-large",
	},
	)
	]
	)

	assert usage["sandbox_count"] == 0
	assert usage["sandbox_estimated_usd"] == 0.0
	assert usage["sandbox_billable_seconds_estimate"] == 0
	assert usage["total_usd"] == 0.0


	def test_aggregate_usage_events_counts_cpu_basic_sandbox_as_free():
	usage = aggregate_usage_events(
	[
	_event(
	"sandbox_create",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"hardware": "cpu-basic",
	},
	),
	_event(
	"sandbox_destroy",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"lifetime_s": 3600,
	},
	),
	]
	)

	assert usage["sandbox_count"] == 1
	assert usage["sandbox_estimated_usd"] == 0.0
	assert usage["sandbox_billable_seconds_estimate"] == 0
	assert usage["total_usd"] == 0.0


	def test_aggregate_usage_events_falls_back_to_sandbox_timestamps():
	usage = aggregate_usage_events(
	[
	_event(
	"sandbox_create",
	{
	"sandbox_id": "alice/sandbox-12345678",
	"hardware": "t4-small",
	},
	created_at="2026-06-01T12:00:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-12345678"},
	created_at="2026-06-01T12:30:00+00:00",
	),
	]
	)

	assert usage["sandbox_count"] == 1
	assert usage["sandbox_billable_seconds_estimate"] == 1800
	assert usage["sandbox_estimated_usd"] == 0.3
	assert usage["total_usd"] == 0.3


	def test_sandbox_lifecycle_pairing_is_shared_for_duplicate_creates():
	events = [
	_event(
	"sandbox_create",
	{"sandbox_id": "alice/sandbox-reused", "hardware": "t4-small"},
	created_at="2026-06-01T12:00:00+00:00",
	),
	_event(
	"sandbox_create",
	{"sandbox_id": "alice/sandbox-reused", "hardware": "cpu-basic"},
	created_at="2026-06-01T12:05:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-reused", "lifetime_s": 300},
	created_at="2026-06-01T12:10:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-reused", "lifetime_s": 1200},
	created_at="2026-06-01T12:20:00+00:00",
	),
	]

	usage = aggregate_usage_events(events, session_id="s1")
	metrics = summarize_usage_events(events, session_id="s1")

	assert usage["sandbox_count"] == 2
	assert usage["sandbox_billable_seconds_estimate"] == 1200
	assert usage["sandbox_estimated_usd"] == 0.2
	assert metrics["sandboxes"]["matched_pairs"] == usage["sandbox_count"]
	assert metrics["sandboxes"]["unpaired_creates"] == 0
	assert metrics["sandboxes"]["unpaired_destroys"] == 0
	assert metrics["sandboxes"]["estimated_usd"] == usage["sandbox_estimated_usd"]


	def test_usage_event_type_allowlists_include_sandbox_lifecycle():
	assert set(USAGE_EVENT_TYPES) >= {"sandbox_create", "sandbox_destroy"}
	assert set(session_persistence.USAGE_EVENT_TYPES) >= {
	"sandbox_create",
	"sandbox_destroy",
	}


	def test_summarize_usage_events_aggregates_dataset_analytics():
	events = [
	_event(
	"llm_call",
	{
	"model": "model-a",
	"kind": "main",
	"cost_usd": 0,
	"prompt_tokens": 10,
	"completion_tokens": 5,
	"cache_read_tokens": 2,
	},
	),
	_event(
	"llm_call",
	{
	"model": "model-b",
	"kind": "research",
	"cost_usd": 0.125,
	"prompt_tokens": 20,
	"completion_tokens": 10,
	"cache_creation_tokens": 3,
	"total_tokens": 40,
	},
	),
	_event("hf_job_submit", {"flavor": "a10g-small"}),
	_event(
	"hf_job_complete",
	{
	"flavor": "a10g-small",
	"final_status": "succeeded",
	"estimated_cost_usd": 0.5,
	"billable_seconds_estimate": 600,
	},
	),
	_event(
	"hf_job_complete",
	{
	"flavor": "cpu-basic",
	"final_status": "failed",
	"wall_time_s": 30,
	},
	),
	_event(
	"sandbox_create",
	{"sandbox_id": "alice/sandbox-1", "hardware": "t4-small"},
	created_at="2026-06-01T12:00:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-1", "lifetime_s": 1800},
	created_at="2026-06-01T12:30:00+00:00",
	),
	_event(
	"sandbox_create",
	{"sandbox_id": "alice/sandbox-2", "hardware": "a100-large"},
	created_at="2026-06-01T13:00:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-missing", "lifetime_s": 60},
	created_at="2026-06-01T13:05:00+00:00",
	),
	_event("turn_complete"),
	_event("assistant_stream_end"),
	{"event_type": "debug", "data": {}},
	]

	metrics = summarize_usage_events(events, session_id="s1")

	assert metrics["version"] == 1
	assert metrics["total_usd_source"] == "app_telemetry_fallback"
	assert metrics["total_usd"] == 0.925
	assert metrics["llm"] == {
	"calls": 2,
	"calls_by_kind": {"main": 1, "research": 1},
	"calls_by_model": {"model-a": 1, "model-b": 1},
	"prompt_tokens": 30,
	"completion_tokens": 15,
	"cache_read_tokens": 2,
	"cache_creation_tokens": 3,
	"total_tokens": 57,
	}
	assert metrics["turns"] == {
	"turn_complete_count": 1,
	"assistant_stream_end_count": 1,
	}
	assert metrics["hf_jobs"]["submits"] == 1
	assert metrics["hf_jobs"]["status_snapshots"] == 2
	assert metrics["hf_jobs"]["statuses"] == {"failed": 1, "succeeded": 1}
	assert metrics["hf_jobs"]["flavors"] == {
	"a10g-small": 2,
	"cpu-basic": 1,
	}
	assert metrics["hf_jobs"]["estimated_usd"] == 0.5
	assert metrics["hf_jobs"]["billable_seconds_estimate"] == 630
	assert metrics["sandboxes"]["creates"] == 2
	assert metrics["sandboxes"]["destroys"] == 2
	assert metrics["sandboxes"]["matched_pairs"] == 1
	assert metrics["sandboxes"]["unpaired_creates"] == 1
	assert metrics["sandboxes"]["unpaired_destroys"] == 1
	assert metrics["sandboxes"]["hardware"] == {"a100-large": 1, "t4-small": 1}
	assert metrics["sandboxes"]["estimated_usd"] == 0.3
	assert metrics["sandboxes"]["billable_seconds_estimate"] == 1800
	assert metrics["data_quality"] == {
	"event_count": 12,
	"events_without_timestamp": 1,
	"llm_calls_with_cost_usd": 2,
	"llm_calls_with_nonzero_cost_usd": 1,
	"job_snapshots_with_estimated_cost": 1,
	"job_snapshots_missing_estimated_cost": 1,
	}

	assert usage_metric_scalar_fields(metrics) == {
	"usage_total_usd": 0.925,
	"usage_total_usd_source": "app_telemetry_fallback",
	"usage_app_total_usd": 0.925,
	"usage_hf_billing_total_usd": None,
	"usage_llm_calls": 2,
	"usage_total_tokens": 57,
	"usage_hf_job_submits": 1,
	"usage_hf_job_status_snapshots": 2,
	"usage_sandbox_creates": 2,
	"usage_sandbox_pairs": 1,
	}


	def test_summarize_usage_events_uses_hf_billing_plus_sandbox_when_available():
	events = [
	_event("llm_call", {"cost_usd": 99.0, "total_tokens": 10}),
	_event("hf_job_complete", {"estimated_cost_usd": 99.0}),
	_event(
	"sandbox_create",
	{"sandbox_id": "alice/sandbox-1", "hardware": "t4-small"},
	created_at="2026-06-01T12:00:00+00:00",
	),
	_event(
	"sandbox_destroy",
	{"sandbox_id": "alice/sandbox-1", "lifetime_s": 1800},
	created_at="2026-06-01T12:30:00+00:00",
	),
	]

	metrics = summarize_usage_events(
	events,
	session_id="s1",
	hf_billing_snapshot={
	"hf_billing": {
	"source": "hf_billing_usage_v2",
	"available": True,
	"current_session": {
	"window_start": "2026-06-01T12:00:00Z",
	"window_end": "2026-06-01T12:30:00Z",
	"timezone": "UTC",
	"total_usd": 1.25,
	"inference_providers_usd": 1.0,
	"hf_jobs_usd": 0.25,
	"inference_provider_requests": 3,
	"hf_jobs_minutes": 1.5,
	"unexpected": "dropped",
	},
	},
	"month": {"total_usd": 999},
	"inference_providers_credits": {"limit_usd": 999},
	},
	)

	assert metrics["total_usd"] == 1.55
	assert metrics["total_usd_source"] == "hf_billing_plus_sandbox_estimate"
	assert metrics["app_total_usd"] == 198.3
	assert metrics["hf_billing_total_usd"] == 1.25
	assert metrics["hf_billing"] == {
	"source": "hf_billing_usage_v2",
	"available": True,
	"error": None,
	"current_session": {
	"window_start": "2026-06-01T12:00:00Z",
	"window_end": "2026-06-01T12:30:00Z",
	"timezone": "UTC",
	"total_usd": 1.25,
	"inference_providers_usd": 1.0,
	"hf_jobs_usd": 0.25,
	"inference_provider_requests": 3,
	"hf_jobs_minutes": 1.5,
	},
	}


	def test_account_bucket_from_hf_billing_usage_v2():
	usage = _account_bucket_from_billing_usage(
	{
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 1_500_000_000,
	"numRequests": 12,
	},
	"jobs": {
	"usedMicroUsd": 250_000,
	"totalMinutes": 3.5,
	},
	}
	},
	window_start=datetime(2026, 6, 1, 0, 0, tzinfo=UTC),
	window_end=datetime(2026, 6, 1, 1, 0, tzinfo=UTC),
	timezone="UTC",
	)

	assert usage["inference_providers_usd"] == 1.5
	assert usage["hf_jobs_usd"] == 0.25
	assert usage["total_usd"] == 1.75
	assert usage["inference_provider_requests"] == 12
	assert usage["hf_jobs_minutes"] == 3.5


	def test_session_bucket_from_inference_session_usage_sums_periods():
	usage = _session_bucket_from_inference_session_usage(
	{
	"currency": "USD",
	"periods": [
	{
	"period": "2026-06-01T00:00:00.000Z",
	"sessions": [
	{"id": "s1", "requestCount": 2, "costCents": 123.4},
	{"id": "s2", "requestCount": 20, "costCents": 999},
	],
	},
	{
	"period": "2026-07-01T00:00:00.000Z",
	"sessions": [
	{"id": "s1", "requestCount": 3, "costCents": 76.6},
	],
	},
	],
	},
	session_id="s1",
	window_start=datetime(2026, 6, 5, 12, 0, tzinfo=UTC),
	window_end=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	timezone="UTC",
	)

	assert usage["inference_providers_usd"] == 2.0
	assert usage["inference_provider_requests"] == 5
	assert usage["hf_jobs_usd"] == 0.0
	assert usage["total_usd"] == 2.0


	def test_session_bucket_from_inference_session_usage_handles_no_matching_session():
	usage = _session_bucket_from_inference_session_usage(
	{
	"currency": "USD",
	"periods": [
	{
	"period": "2026-06-01T00:00:00.000Z",
	"sessions": [{"id": "other", "requestCount": 1, "costCents": 50}],
	},
	],
	},
	session_id="s1",
	window_start=datetime(2026, 6, 5, 12, 0, tzinfo=UTC),
	window_end=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	timezone="UTC",
	)

	assert usage["inference_providers_usd"] == 0.0
	assert usage["inference_provider_requests"] == 0
	assert usage["total_usd"] == 0.0


	def test_usage_windows_respect_browser_timezone():
	windows = resolve_usage_windows(
	"America/Los_Angeles",
	now=datetime(2026, 6, 1, 7, 30, tzinfo=UTC),
	)

	assert windows["timezone"] == "America/Los_Angeles"
	assert windows["month_start_utc"] == datetime(2026, 6, 1, 7, 0, tzinfo=UTC)


	class _NoopStore:
	enabled = False


	class _RecordingStore:
	enabled = True

	def __init__(self):
	self.calls = []

	async def load_usage_events(self, user_id, **kwargs):
	self.calls.append((user_id, kwargs))
	return []


	class _Manager:
	def __init__(self, sessions, store=None):
	self.sessions = sessions
	self.store = store or _NoopStore()

	def _store(self):
	return self.store


	class _MetadataStore(_NoopStore):
	enabled = True

	def __init__(self, metadata):
	self.metadata = metadata

	async def load_session(self, session_id):
	return {"metadata": {"session_id": session_id, **self.metadata}, "messages": []}

	async def load_usage_events(self, user_id, **kwargs):
	return []


	def _agent_session(session_id, user_id, events):
	return SimpleNamespace(
	session_id=session_id,
	user_id=user_id,
	inference_billing_session_id=BILLING_SESSION_ID,
	session=SimpleNamespace(logged_events=events),
	)


	@pytest.mark.asyncio
	async def test_hf_billing_snapshot_uses_session_window_without_account_totals(
	monkeypatch,
	):
	usage_window_started_at = datetime(2026, 6, 5, 12, 30, tzinfo=UTC)
	manager = _Manager(
	{
	"s1": SimpleNamespace(
	session_id="s1",
	user_id="owner",
	created_at=datetime(2026, 6, 5, 12, 0, tzinfo=UTC),
	usage_window_started_at=usage_window_started_at,
	session=SimpleNamespace(logged_events=[]),
	)
	}
	)
	calls = []

	async def fake_usage_v2(_token, *, start, end):
	calls.append((start, end))
	return {
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 1_500_000_000,
	"includedNanoUsd": 2_000_000_000,
	"limitNanoUsd": 5_000_000_000,
	"numRequests": 4,
	},
	"jobs": {"usedMicroUsd": 250_000, "totalMinutes": 3.5},
	}
	}

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_usage_v2)

	snapshot = await build_hf_billing_snapshot(
	manager,
	hf_token="hf_fake",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert calls == [(usage_window_started_at, datetime(2026, 6, 5, 13, 0, tzinfo=UTC))]
	assert snapshot == {
	"billing_scope": "account_window_delta",
	"hf_billing": {
	"source": "hf_billing_usage_v2",
	"available": True,
	"error": None,
	"current_session": {
	"window_start": "2026-06-05T12:30:00Z",
	"window_end": "2026-06-05T13:00:00Z",
	"timezone": "UTC",
	"total_usd": 1.75,
	"inference_providers_usd": 1.5,
	"hf_jobs_usd": 0.25,
	"inference_provider_requests": 4,
	"hf_jobs_minutes": 3.5,
	},
	},
	}


	@pytest.mark.asyncio
	async def test_usage_response_omits_app_rollups_without_session():
	manager = _Manager(
	{
	"owner-session": _agent_session(
	"owner-session",
	"owner",
	[_event("llm_call", {"cost_usd": 0.5})],
	),
	"other-session": _agent_session(
	"other-session",
	"other",
	[_event("llm_call", {"cost_usd": 99.0})],
	),
	}
	)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	session_id=None,
	timezone_name="UTC",
	now=datetime(2026, 6, 1, 13, 0, tzinfo=UTC),
	)

	assert usage["session"] is None


	@pytest.mark.asyncio
	async def test_runtime_usage_includes_requested_session_total():
	manager = _Manager(
	{
	"s1": _agent_session(
	"s1",
	"owner",
	[
	_event(
	"llm_call",
	{"cost_usd": 0.25},
	created_at="2026-05-01T12:00:00+00:00",
	)
	],
	)
	}
	)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 1, 13, 0, tzinfo=UTC),
	)

	assert usage["session"]["session_id"] == "s1"
	assert usage["session"]["inference_usd"] == 0.25


	@pytest.mark.asyncio
	async def test_runtime_usage_clips_requested_session_to_usage_window():
	usage_window_started_at = datetime(2026, 6, 5, 12, 30, tzinfo=UTC)
	manager = _Manager(
	{
	"s1": SimpleNamespace(
	session_id="s1",
	user_id="owner",
	usage_window_started_at=usage_window_started_at,
	session=SimpleNamespace(
	logged_events=[
	_event(
	"llm_call",
	{"cost_usd": 99.0},
	created_at="2026-06-05T12:00:00+00:00",
	),
	_event(
	"llm_call",
	{"cost_usd": 0.25},
	created_at="2026-06-05T12:45:00+00:00",
	),
	_event(
	"hf_job_complete",
	{
	"estimated_cost_usd": 1.5,
	"billable_seconds_estimate": 1800,
	},
	created_at="2026-06-05T12:50:00+00:00",
	),
	]
	),
	)
	}
	)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["session"]["inference_usd"] == 0.25
	assert usage["session"]["hf_jobs_estimated_usd"] == 1.5
	assert usage["session"]["total_usd"] == 1.75


	@pytest.mark.asyncio
	async def test_runtime_usage_includes_requested_session_tokens():
	manager = _Manager(
	{
	"s1": _agent_session(
	"s1",
	"owner",
	[
	_event(
	"llm_call",
	{"cost_usd": 0.25, "total_tokens": 42},
	created_at="2026-06-05T15:00:00",
	)
	],
	)
	}
	)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	session_id="s1",
	timezone_name="Europe/Zurich",
	now=datetime(2026, 6, 5, 13, 30, tzinfo=UTC),
	)

	assert usage["session"]["llm_calls"] == 1
	assert usage["session"]["total_tokens"] == 42


	@pytest.mark.asyncio
	async def test_hf_account_usage_reports_missing_token_error():
	manager = _Manager({})

	usage = await build_usage_response(
	manager,
	user_id="owner",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["hf_account"]["available"] is False
	assert usage["hf_account"]["error"] == "missing_hf_token"


	@pytest.mark.asyncio
	async def test_hf_account_usage_reports_billing_unavailable_error(monkeypatch):
	manager = _Manager({})

	async def fake_fetch(_token, *, start, end):
	return None

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_fetch)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	hf_token="hf_fake",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["hf_account"]["available"] is False
	assert usage["hf_account"]["error"] == "billing_usage_unavailable"


	@pytest.mark.asyncio
	async def test_hf_account_usage_uses_session_endpoint_for_current_session(
	monkeypatch,
	):
	session_created_at = datetime(2026, 6, 5, 12, 0, tzinfo=UTC)
	usage_window_started_at = datetime(2026, 6, 5, 12, 30, tzinfo=UTC)
	manager = _Manager(
	{
	"s1": SimpleNamespace(
	session_id="s1",
	user_id="owner",
	created_at=session_created_at,
	usage_window_started_at=usage_window_started_at,
	inference_billing_session_id=BILLING_SESSION_ID,
	session=SimpleNamespace(logged_events=[]),
	)
	}
	)
	usage_v2_calls = []
	session_usage_calls = []

	async def fake_usage_v2(_token, *, start, end):
	usage_v2_calls.append((start, end))
	return {
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 2_000_000_000,
	"includedNanoUsd": 2_000_000_000,
	"limitNanoUsd": 5_000_000_000,
	"numRequests": 4,
	},
	"jobs": {"usedMicroUsd": 0, "totalMinutes": 0},
	}
	}

	async def fake_session_usage(_token, *, start, end):
	session_usage_calls.append((start, end))
	return {
	"currency": "USD",
	"periods": [
	{
	"period": "2026-06-01T00:00:00.000Z",
	"sessions": [
	{
	"id": BILLING_SESSION_ID,
	"requestCount": 3,
	"costCents": 125,
	},
	{"id": "s1", "requestCount": 11, "costCents": 500},
	{"id": "other", "requestCount": 9, "costCents": 999},
	],
	}
	],
	}

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_usage_v2)
	monkeypatch.setattr("usage._fetch_hf_inference_session_usage", fake_session_usage)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	hf_token="hf_fake",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["hf_account"]["available"] is True
	assert usage["hf_account"]["current_session"]["inference_providers_usd"] == 1.25
	assert usage["hf_account"]["current_session"]["inference_provider_requests"] == 3
	assert usage["hf_account"]["month"]["inference_providers_usd"] == 2.0
	assert usage["hf_account"]["inference_providers_credits"] == {
	"included_usd": 2.0,
	"used_usd": 2.0,
	"remaining_included_usd": 0.0,
	"limit_usd": 5.0,
	"remaining_limit_usd": 3.0,
	"num_requests": 4,
	"period_start": None,
	"period_end": None,
	}
	assert usage_v2_calls == [
	(
	datetime(2026, 6, 1, 0, 0, tzinfo=UTC),
	datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)
	]
	assert session_usage_calls == [
	(usage_window_started_at, datetime(2026, 6, 5, 13, 0, tzinfo=UTC))
	]


	@pytest.mark.asyncio
	async def test_hf_account_usage_keeps_account_available_when_session_endpoint_fails(
	monkeypatch,
	):
	usage_window_started_at = datetime(2026, 6, 5, 12, 30, tzinfo=UTC)
	manager = _Manager(
	{
	"s1": SimpleNamespace(
	session_id="s1",
	user_id="owner",
	created_at=datetime(2026, 6, 5, 12, 0, tzinfo=UTC),
	usage_window_started_at=usage_window_started_at,
	inference_billing_session_id=BILLING_SESSION_ID,
	session=SimpleNamespace(logged_events=[]),
	)
	}
	)

	async def fake_usage_v2(_token, *, start, end):
	return {
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 2_000_000_000,
	"numRequests": 10,
	},
	"jobs": {"usedMicroUsd": 500_000, "totalMinutes": 4.0},
	}
	}

	async def fake_session_usage(_token, *, start, end):
	return None

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_usage_v2)
	monkeypatch.setattr("usage._fetch_hf_inference_session_usage", fake_session_usage)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	hf_token="hf_fake",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["hf_account"]["available"] is True
	assert usage["hf_account"]["current_session"] is None
	assert usage["hf_account"]["month"]["inference_providers_usd"] == 2.0
	assert "error" not in usage["hf_account"]


	@pytest.mark.asyncio
	async def test_hf_account_usage_falls_back_to_persisted_created_at(monkeypatch):
	session_created_at = datetime(2026, 6, 5, 12, 0, tzinfo=UTC)
	store = _MetadataStore(
	{
	"created_at": session_created_at,
	"inference_billing_session_id": BILLING_SESSION_ID,
	}
	)
	manager = _Manager({}, store=store)
	usage_v2_calls = []
	session_usage_calls = []

	async def fake_usage_v2(_token, *, start, end):
	usage_v2_calls.append((start, end))
	return {
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 0,
	"includedNanoUsd": 0,
	"limitNanoUsd": 0,
	},
	"jobs": {"usedMicroUsd": 0, "totalMinutes": 0},
	}
	}

	async def fake_session_usage(_token, *, start, end):
	session_usage_calls.append((start, end))
	return {"currency": "USD", "periods": []}

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_usage_v2)
	monkeypatch.setattr("usage._fetch_hf_inference_session_usage", fake_session_usage)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	hf_token="hf_fake",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert usage["hf_account"]["current_session"]["window_start"] == (
	"2026-06-05T12:00:00Z"
	)
	assert usage_v2_calls == [
	(
	datetime(2026, 6, 1, 0, 0, tzinfo=UTC),
	datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)
	]
	assert session_usage_calls == [
	(session_created_at, datetime(2026, 6, 5, 13, 0, tzinfo=UTC))
	]


	@pytest.mark.asyncio
	async def test_usage_response_loads_only_session_events(monkeypatch):
	session_created_at = datetime(2026, 6, 5, 12, 0, tzinfo=UTC)
	store = _RecordingStore()
	manager = _Manager(
	{
	"s1": SimpleNamespace(
	session_id="s1",
	user_id="owner",
	created_at=session_created_at,
	inference_billing_session_id=BILLING_SESSION_ID,
	session=SimpleNamespace(logged_events=[]),
	)
	},
	store=store,
	)
	usage_v2_starts = []
	session_usage_starts = []

	async def fake_usage_v2(_token, *, start, end):
	usage_v2_starts.append(start)
	return {
	"usage": {
	"inferenceProviders": {
	"usedNanoUsd": 0,
	"includedNanoUsd": 2_000_000_000,
	"limitNanoUsd": 0,
	},
	"jobs": {"usedMicroUsd": 0, "totalMinutes": 0},
	}
	}

	async def fake_session_usage(_token, *, start, end):
	session_usage_starts.append(start)
	return {"currency": "USD", "periods": []}

	monkeypatch.setattr("usage._fetch_hf_billing_usage_v2", fake_usage_v2)
	monkeypatch.setattr("usage._fetch_hf_inference_session_usage", fake_session_usage)

	usage = await build_usage_response(
	manager,
	user_id="owner",
	hf_token="hf_fake",
	session_id="s1",
	timezone_name="UTC",
	now=datetime(2026, 6, 5, 13, 0, tzinfo=UTC),
	)

	assert store.calls == [
	(
	"owner",
	{"session_id": "s1", "start": session_created_at, "end": None},
	)
	]
	assert usage_v2_starts == [datetime(2026, 6, 1, 0, 0, tzinfo=UTC)]
	assert session_usage_starts == [session_created_at]
	assert datetime(2026, 6, 5, 0, 0, tzinfo=UTC) not in usage_v2_starts
	assert datetime(2026, 6, 5, 0, 0, tzinfo=UTC) not in session_usage_starts
	assert usage["hf_account"]["month"]["inference_providers_usd"] == 0.0