Spaces:

f2d90b38
/

ggload

Runtime error

App Files Files Community

ggload / app /services /reverse /ws_imagine.py

f2d90b38

Upload 120 files

8cdca00 verified about 2 months ago

raw

history blame contribute delete

10.5 kB

	"""
	Reverse interface: Imagine WebSocket image stream.
	"""

	import asyncio
	import orjson
	import re
	import time
	import uuid
	from typing import AsyncGenerator, Dict, Optional

	import aiohttp

	from app.core.config import get_config
	from app.core.logger import logger
	from app.services.reverse.utils.headers import build_ws_headers
	from app.services.reverse.utils.websocket import WebSocketClient

	WS_IMAGINE_URL = "wss://grok.com/ws/imagine/listen"


	class _BlockedError(Exception):
	pass


	class ImagineWebSocketReverse:
	"""Imagine WebSocket reverse interface."""

	def __init__(self) -> None:
	self._url_pattern = re.compile(r"/images/([a-f0-9-]+)\.(png\|jpg\|jpeg)")
	self._client = WebSocketClient()

	def _parse_image_url(self, url: str) -> tuple[Optional[str], Optional[str]]:
	match = self._url_pattern.search(url or "")
	if not match:
	return None, None
	return match.group(1), match.group(2).lower()

	def _is_final_image(self, url: str, blob_size: int, final_min_bytes: int) -> bool:
	url_lower = (url or "").lower()
	if url_lower.endswith((".jpg", ".jpeg")):
	return True
	return blob_size > final_min_bytes

	def _classify_image(self, url: str, blob: str, final_min_bytes: int, medium_min_bytes: int) -> Optional[Dict[str, object]]:
	if not url or not blob:
	return None

	image_id, ext = self._parse_image_url(url)
	image_id = image_id or uuid.uuid4().hex
	blob_size = len(blob)
	is_final = self._is_final_image(url, blob_size, final_min_bytes)

	stage = (
	"final"
	if is_final
	else ("medium" if blob_size > medium_min_bytes else "preview")
	)

	return {
	"type": "image",
	"image_id": image_id,
	"ext": ext,
	"stage": stage,
	"blob": blob,
	"blob_size": blob_size,
	"url": url,
	"is_final": is_final,
	}

	def _build_request_message(self, request_id: str, prompt: str, aspect_ratio: str, enable_nsfw: bool) -> Dict[str, object]:
	return {
	"type": "conversation.item.create",
	"timestamp": int(time.time() * 1000),
	"item": {
	"type": "message",
	"content": [
	{
	"requestId": request_id,
	"text": prompt,
	"type": "input_text",
	"properties": {
	"section_count": 0,
	"is_kids_mode": False,
	"enable_nsfw": enable_nsfw,
	"skip_upsampler": False,
	"is_initial": False,
	"aspect_ratio": aspect_ratio,
	},
	}
	],
	},
	}

	async def stream(
	self,
	token: str,
	prompt: str,
	aspect_ratio: str = "2:3",
	n: int = 1,
	enable_nsfw: bool = True,
	max_retries: Optional[int] = None,
	) -> AsyncGenerator[Dict[str, object], None]:
	retries = max(1, max_retries if max_retries is not None else 1)
	logger.info(
	f"Image generation: prompt='{prompt[:50]}...', n={n}, ratio={aspect_ratio}, nsfw={enable_nsfw}"
	)

	for attempt in range(retries):
	try:
	yielded_any = False
	async for item in self._stream_once(
	token, prompt, aspect_ratio, n, enable_nsfw
	):
	yielded_any = True
	yield item
	return
	except _BlockedError:
	if yielded_any or attempt + 1 >= retries:
	if not yielded_any:
	yield {
	"type": "error",
	"error_code": "blocked",
	"error": "blocked_no_final_image",
	}
	return
	logger.warning(f"WebSocket blocked, retry {attempt + 1}/{retries}")
	except Exception as e:
	logger.error(f"WebSocket stream failed: {e}")
	yield {
	"type": "error",
	"error_code": "ws_stream_failed",
	"error": str(e),
	}
	return

	async def _stream_once(
	self,
	token: str,
	prompt: str,
	aspect_ratio: str,
	n: int,
	enable_nsfw: bool,
	) -> AsyncGenerator[Dict[str, object], None]:
	request_id = str(uuid.uuid4())
	headers = build_ws_headers(token=token)
	timeout = float(get_config("image.timeout"))
	stream_timeout = float(get_config("image.stream_timeout"))
	final_timeout = float(get_config("image.final_timeout"))
	blocked_grace = min(10.0, final_timeout)
	final_min_bytes = int(get_config("image.final_min_bytes"))
	medium_min_bytes = int(get_config("image.medium_min_bytes"))

	try:
	conn = await self._client.connect(
	WS_IMAGINE_URL,
	headers=headers,
	timeout=timeout,
	ws_kwargs={
	"heartbeat": 20,
	"receive_timeout": stream_timeout,
	},
	)
	except Exception as e:
	status = getattr(e, "status", None)
	error_code = (
	"rate_limit_exceeded" if status == 429 else "connection_failed"
	)
	logger.error(f"WebSocket connect failed: {e}")
	yield {
	"type": "error",
	"error_code": error_code,
	"status": status,
	"error": str(e),
	}
	return

	try:
	async with conn as ws:
	message = self._build_request_message(
	request_id, prompt, aspect_ratio, enable_nsfw
	)
	await ws.send_json(message)
	logger.info(f"WebSocket request sent: {prompt[:80]}...")

	final_ids: set[str] = set()
	completed = 0
	start_time = last_activity = time.monotonic()
	medium_received_time: Optional[float] = None

	while time.monotonic() - start_time < timeout:
	try:
	ws_msg = await asyncio.wait_for(ws.receive(), timeout=5.0)
	except asyncio.TimeoutError:
	now = time.monotonic()
	if (
	medium_received_time
	and completed == 0
	and now - medium_received_time > blocked_grace
	):
	raise _BlockedError()
	if completed > 0 and now - last_activity > 10:
	logger.info(
	f"WebSocket idle timeout, collected {completed} images"
	)
	break
	continue

	if ws_msg.type == aiohttp.WSMsgType.TEXT:
	last_activity = time.monotonic()
	try:
	msg = orjson.loads(ws_msg.data)
	except orjson.JSONDecodeError as e:
	logger.warning(f"WebSocket message decode failed: {e}")
	continue

	msg_type = msg.get("type")

	if msg_type == "image":
	info = self._classify_image(
	msg.get("url", ""),
	msg.get("blob", ""),
	final_min_bytes,
	medium_min_bytes,
	)
	if not info:
	continue

	image_id = info["image_id"]
	if info["stage"] == "medium" and medium_received_time is None:
	medium_received_time = time.monotonic()

	if info["is_final"] and image_id not in final_ids:
	final_ids.add(image_id)
	completed += 1
	logger.debug(
	f"Final image received: id={image_id}, size={info['blob_size']}"
	)

	yield info

	elif msg_type == "error":
	logger.warning(
	f"WebSocket error: {msg.get('err_code', '')} - {msg.get('err_msg', '')}"
	)
	yield {
	"type": "error",
	"error_code": msg.get("err_code", ""),
	"error": msg.get("err_msg", ""),
	}
	return

	if completed >= n:
	logger.info(f"WebSocket collected {completed} final images")
	break

	if (
	medium_received_time
	and completed == 0
	and time.monotonic() - medium_received_time > final_timeout
	):
	raise _BlockedError()

	elif ws_msg.type in (
	aiohttp.WSMsgType.CLOSED,
	aiohttp.WSMsgType.ERROR,
	):
	logger.warning(f"WebSocket closed/error: {ws_msg.type}")
	yield {
	"type": "error",
	"error_code": "ws_closed",
	"error": f"websocket closed: {ws_msg.type}",
	}
	break

	except aiohttp.ClientError as e:
	logger.error(f"WebSocket connection error: {e}")
	yield {"type": "error", "error_code": "connection_failed", "error": str(e)}


	__all__ = ["ImagineWebSocketReverse", "WS_IMAGINE_URL"]