starlight / inference.py

Upload inference.py with huggingface_hub

140e2df verified 3 months ago

13.1 kB

	# inference.py
	import numpy as np
	from PIL import Image
	import os
	import sys
	import json
	from typing import Dict, Any

	# Optional ONNX imports
	try:
	import onnx
	import onnxruntime as ort
	ONNX_AVAILABLE = True
	except ImportError:
	ONNX_AVAILABLE = False
	print("Warning: ONNX not available. Neural network features disabled.")

	# Optional Hugging Face imports
	try:
	from transformers import Pipeline
	HF_AVAILABLE = True
	except ImportError:
	HF_AVAILABLE = False
	print("Warning: Hugging Face transformers not available. Pipeline features disabled.")

	# Add scripts directory to import utilities
	scripts_dir = os.path.join(os.path.dirname(os.path.abspath(__file__)), "scripts")
	if scripts_dir not in sys.path:
	sys.path.append(scripts_dir)

	# Import unified input loader
	try:
	from starlight_utils import load_unified_input
	except ImportError as e:
	print(f"Warning: Could not import starlight_utils: {e}")
	load_unified_input = None


	class StarlightModel:
	def __init__(
	self,
	detector_path: str = "model/detector.onnx",
	task: str = "detect"
	):
	self.detector_path = detector_path
	self.task = task

	# Load ONNX model
	if ONNX_AVAILABLE:
	providers = []
	available_providers = ort.get_available_providers()
	if 'CUDAExecutionProvider' in available_providers:
	providers.append('CUDAExecutionProvider')
	if 'CoreMLExecutionProvider' in available_providers:
	providers.append('CoreMLExecutionProvider')
	providers.append('CPUExecutionProvider')

	session_options = ort.SessionOptions()
	if 'CUDAExecutionProvider' in providers:
	session_options.enable_mem_pattern = False
	elif 'CoreMLExecutionProvider' in providers:
	session_options.enable_mem_pattern = False

	if os.path.exists(detector_path):
	try:
	self.detector = ort.InferenceSession(detector_path, sess_options=session_options, providers=providers)
	except Exception as e:
	print(f"Warning: Could not load detector: {e}")
	self.detector = None
	else:
	print(f"Warning: Detector model not found at {detector_path}")
	self.detector = None
	else:
	self.detector = None

	def _detect_method_from_filename(self, img_path: str) -> str:
	basename = os.path.basename(img_path)
	parts = basename.split("_")
	if len(parts) >= 3:
	method = parts[-2] # e.g., alpha, eoi, dct
	return method
	return "lsb" # Default fallback

	def predict(self, img_path: str, method: str = None) -> Dict[str, Any]:
	if not load_unified_input:
	return {"error": "starlight_utils not available"}

	# Use unified input loader (aligned with scanner.py design)
	pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(img_path, fast_mode=True)

	# Convert to numpy for ONNX and add batch dimension
	# Note: lsb and alpha need to be in CHW format for ONNX
	lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb # (3, 256, 256)
	alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha # (1, 256, 256)

	inputs = {
	'meta': np.expand_dims(meta.numpy(), 0),
	'alpha': np.expand_dims(alpha_chw.numpy(), 0),
	'lsb': np.expand_dims(lsb_chw.numpy(), 0),
	'palette': np.expand_dims(palette.numpy(), 0),
	'format_features': np.expand_dims(format_features.numpy(), 0),
	'content_features': np.expand_dims(content_features.numpy(), 0),
	'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32) # Default msb-first
	}

	method = method or self._detect_method_from_filename(img_path)

	if self.task == "detect":
	if self.detector:
	try:
	outputs = self.detector.run(None, inputs)
	stego_logits = outputs[0]
	method_logits = outputs[1]
	method_id = outputs[2]
	method_probs = outputs[3]

	prob = float(1 / (1 + np.exp(-stego_logits[0][0]))) # Sigmoid
	predicted_method = int(np.argmax(method_logits[0]))

	return {
	"image_path": img_path,
	"stego_probability": prob,
	"task": self.task,
	"method": method,
	"predicted_method_id": predicted_method,
	"predicted": prob > 0.5
	}
	except Exception as e:
	return {"error": f"ONNX inference failed: {e}"}
	else:
	return {"error": "Detector model not loaded"}
	else:
	return {"error": f"Task '{self.task}' not supported in unified design"}


	if ONNX_AVAILABLE and load_unified_input:
	class StarlightSteganographyDetectionPipeline:
	def __init__(self, model_path=None, config_path="config.json", **kwargs):
	# Load config
	if not os.path.exists(config_path):
	raise FileNotFoundError(f"Config file not found at {config_path}")
	with open(config_path, 'r') as f:
	self.config = json.load(f)

	if model_path is None:
	model_path = self.config.get("model_path", "models/detector_balanced.onnx")

	# Load ONNX model
	providers = []
	available_providers = ort.get_available_providers()
	if 'CUDAExecutionProvider' in available_providers:
	providers.append('CUDAExecutionProvider')
	if 'CoreMLExecutionProvider' in available_providers:
	providers.append('CoreMLExecutionProvider')
	providers.append('CPUExecutionProvider')

	session_options = ort.SessionOptions()
	if 'CUDAExecutionProvider' in providers:
	session_options.enable_mem_pattern = False
	elif 'CoreMLExecutionProvider' in providers:
	session_options.enable_mem_pattern = False

	if not os.path.exists(model_path):
	raise FileNotFoundError(f"Model not found at {model_path}")

	self.model = ort.InferenceSession(model_path, sess_options=session_options, providers=providers)

	def __call__(self, image_path, **kwargs):
	sanitized_kwargs, _, _ = self._sanitize_parameters(**kwargs)
	model_inputs = self.preprocess(image_path)
	model_outputs = self._forward(model_inputs)
	return self.postprocess(model_outputs)

	def _sanitize_parameters(self, **kwargs):
	# No specific parameters to sanitize for now
	return {}, {}, {}

	def preprocess(self, image_path):
	if not isinstance(image_path, str) or not os.path.exists(image_path):
	raise ValueError(f"Invalid image_path: {image_path}")

	# Use unified input loader
	try:
	pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(image_path, fast_mode=True)
	except Exception as e:
	raise ValueError(f"Failed to preprocess image {image_path}: {e}")

	# Convert to numpy for ONNX and add batch dimension
	# Note: lsb and alpha need to be in CHW format for ONNX
	lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb # (3, 256, 256)
	alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha # (1, 256, 256)

	model_inputs = {
	'meta': np.expand_dims(meta.numpy(), 0),
	'alpha': np.expand_dims(alpha_chw.numpy(), 0),
	'lsb': np.expand_dims(lsb_chw.numpy(), 0),
	'palette': np.expand_dims(palette.numpy(), 0),
	'format_features': np.expand_dims(format_features.numpy(), 0),
	'content_features': np.expand_dims(content_features.numpy(), 0),
	'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32) # Default msb-first
	}

	return model_inputs

	def _forward(self, model_inputs):
	try:
	outputs = self.model.run(None, model_inputs)
	return {
	'stego_logits': outputs[0],
	'method_logits': outputs[1],
	}
	except Exception as e:
	raise RuntimeError(f"ONNX inference failed: {e}")

	def postprocess(self, model_outputs):
	stego_logits = model_outputs['stego_logits']
	method_logits = model_outputs['method_logits']

	prob = float(1 / (1 + np.exp(-stego_logits[0][0]))) # Sigmoid

	method_probs = np.exp(method_logits[0]) / np.sum(np.exp(method_logits[0]))
	predicted_method_id = int(np.argmax(method_logits[0]))
	predicted_method_name = self.config["id2label"].get(str(predicted_method_id), "unknown")

	return {
	"stego_probability": prob,
	"predicted_method": predicted_method_name,
	"predicted_method_id": predicted_method_id,
	"predicted_method_prob": float(method_probs[predicted_method_id]),
	"is_steganography": prob > 0.5
	}

	def _sanitize_parameters(self, **kwargs):
	# No specific parameters to sanitize for now
	return {}, {}, {}

	def preprocess(self, image_path):
	if not isinstance(image_path, str) or not os.path.exists(image_path):
	raise ValueError(f"Invalid image_path: {image_path}")

	# Use unified input loader
	try:
	pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(image_path, fast_mode=True)
	except Exception as e:
	raise ValueError(f"Failed to preprocess image {image_path}: {e}")

	# Convert to numpy for ONNX and add batch dimension
	# Note: lsb and alpha need to be in CHW format for ONNX
	lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb # (3, 256, 256)
	alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha # (1, 256, 256)

	model_inputs = {
	'meta': np.expand_dims(meta.numpy(), 0),
	'alpha': np.expand_dims(alpha_chw.numpy(), 0),
	'lsb': np.expand_dims(lsb_chw.numpy(), 0),
	'palette': np.expand_dims(palette.numpy(), 0),
	'format_features': np.expand_dims(format_features.numpy(), 0),
	'content_features': np.expand_dims(content_features.numpy(), 0),
	'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32) # Default msb-first
	}

	return model_inputs

	def _forward(self, model_inputs):
	try:
	outputs = self.model.run(None, model_inputs)
	return {
	'stego_logits': outputs[0],
	'method_logits': outputs[1],
	}
	except Exception as e:
	raise RuntimeError(f"ONNX inference failed: {e}")

	def postprocess(self, model_outputs):
	stego_logits = model_outputs['stego_logits']
	method_logits = model_outputs['method_logits']

	prob = float(1 / (1 + np.exp(-stego_logits[0][0]))) # Sigmoid

	method_probs = np.exp(method_logits[0]) / np.sum(np.exp(method_logits[0]))
	predicted_method_id = int(np.argmax(method_logits[0]))
	predicted_method_name = self.config["id2label"].get(str(predicted_method_id), "unknown")

	return {
	"stego_probability": prob,
	"predicted_method": predicted_method_name,
	"predicted_method_id": predicted_method_id,
	"predicted_method_prob": float(method_probs[predicted_method_id]),
	"is_steganography": prob > 0.5
	}

	# Convenience functions for specific tasks
	def detect_steganography(img_path):
	"""Detect steganography using the unified model."""
	model = StarlightModel(task="detect")
	return model.predict(img_path)

	def get_starlight_pipeline():
	"""
	Initializes and returns the StarlightSteganographyDetectionPipeline.
	Raises ImportError if dependencies are not met.
	"""
	if not ONNX_AVAILABLE:
	raise ImportError("ONNX runtime library not found. Please install it with 'pip install onnxruntime'.")
	if not load_unified_input:
	raise ImportError("starlight_utils could not be imported. Please ensure the 'scripts' directory is in your Python path.")

	return StarlightSteganographyDetectionPipeline()