nvidia
/

Cosmos3-Super-Text2Image

image-generation

Model card Files Files and versions

Cosmos3-Super-Text2Image / agentic_upsampling /constants.py

mingyuliutw's picture

Super-squash branch 'main' using huggingface_hub

fdafd05 2 days ago

1.24 kB

	"""Public defaults for the standalone agentic text-to-image upsampler."""

	from __future__ import annotations

	from typing import Any

	DEFAULT_OPENAI_ENDPOINT_URL = "https://api.openai.com/v1"
	DEFAULT_UPSAMPLER_ENDPOINT_URL = DEFAULT_OPENAI_ENDPOINT_URL
	DEFAULT_REWRITER_ENDPOINT_URL = DEFAULT_OPENAI_ENDPOINT_URL
	DEFAULT_UPSAMPLER_MODEL = "gpt-5.5"
	DEFAULT_REWRITER_MODEL = "gpt-5.5"
	DEFAULT_OPENAI_API_KEY_ENV = "OPENAI_API_KEY"
	DEFAULT_LLM_EXTRA_BODY: dict[str, Any] = {"reasoning_effort": "low"}

	DEFAULT_CRITIC_ENDPOINT_URL = "https://generativelanguage.googleapis.com/v1beta/openai/"
	DEFAULT_CRITIC_MODEL = "gemini-3.1-pro-preview"
	DEFAULT_GEMINI_API_KEY_ENV = "GEMINI_API_KEY"

	DEFAULT_GENERATION_AUTH_KEY_ENV = "AGENTIC_UPSAMPLING_GENERATION_AUTH_KEY"
	DEFAULT_GENERATION_MODEL = "nvidia/Cosmos3-Super-Text2Image"
	DEFAULT_IMAGE_SIZE = "1024x1024"
	DEFAULT_GENERATION_EXTRA_ARGS: dict[str, Any] = {"guardrails": False, "use_resolution_template": False}

	DEFAULT_RESOLUTION = "768"
	DEFAULT_ASPECT_RATIO = "1,1"
	DEFAULT_NUM_STEPS = 50
	DEFAULT_GUIDANCE = 4.0
	DEFAULT_FLOW_SHIFT = 3.0
	DEFAULT_MAX_ITERATIONS = 2
	DEFAULT_SAMPLES_PER_ITERATION = 3
	DEFAULT_JPEG_QUALITY = 99

	STRICT_OVERALL_THRESHOLD = 9.0
	STRICT_PROMPT_THRESHOLD = 9.0