File size: 13,060 Bytes

140e2df

# inference.py
import numpy as np
from PIL import Image
import os
import sys
import json
from typing import Dict, Any

# Optional ONNX imports
try:
    import onnx
    import onnxruntime as ort
    ONNX_AVAILABLE = True
except ImportError:
    ONNX_AVAILABLE = False
    print("Warning: ONNX not available. Neural network features disabled.")

# Optional Hugging Face imports
try:
    from transformers import Pipeline
    HF_AVAILABLE = True
except ImportError:
    HF_AVAILABLE = False
    print("Warning: Hugging Face transformers not available. Pipeline features disabled.")

# Add scripts directory to import utilities
scripts_dir = os.path.join(os.path.dirname(os.path.abspath(__file__)), "scripts")
if scripts_dir not in sys.path:
    sys.path.append(scripts_dir)

# Import unified input loader
try:
    from starlight_utils import load_unified_input
except ImportError as e:
    print(f"Warning: Could not import starlight_utils: {e}")
    load_unified_input = None


class StarlightModel:
    def __init__(
        self,
        detector_path: str = "model/detector.onnx",
        task: str = "detect"
    ):
        self.detector_path = detector_path
        self.task = task

        # Load ONNX model
        if ONNX_AVAILABLE:
            providers = []
            available_providers = ort.get_available_providers()
            if 'CUDAExecutionProvider' in available_providers:
                providers.append('CUDAExecutionProvider')
            if 'CoreMLExecutionProvider' in available_providers:
                providers.append('CoreMLExecutionProvider')
            providers.append('CPUExecutionProvider')

            session_options = ort.SessionOptions()
            if 'CUDAExecutionProvider' in providers:
                session_options.enable_mem_pattern = False
            elif 'CoreMLExecutionProvider' in providers:
                session_options.enable_mem_pattern = False

            if os.path.exists(detector_path):
                try:
                    self.detector = ort.InferenceSession(detector_path, sess_options=session_options, providers=providers)
                except Exception as e:
                    print(f"Warning: Could not load detector: {e}")
                    self.detector = None
            else:
                print(f"Warning: Detector model not found at {detector_path}")
                self.detector = None
        else:
            self.detector = None

    def _detect_method_from_filename(self, img_path: str) -> str:
        basename = os.path.basename(img_path)
        parts = basename.split("_")
        if len(parts) >= 3:
            method = parts[-2]  # e.g., alpha, eoi, dct
            return method
        return "lsb"  # Default fallback

    def predict(self, img_path: str, method: str = None) -> Dict[str, Any]:
        if not load_unified_input:
            return {"error": "starlight_utils not available"}

        # Use unified input loader (aligned with scanner.py design)
        pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(img_path, fast_mode=True)

        # Convert to numpy for ONNX and add batch dimension
        # Note: lsb and alpha need to be in CHW format for ONNX
        lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb  # (3, 256, 256)
        alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha  # (1, 256, 256)

        inputs = {
            'meta': np.expand_dims(meta.numpy(), 0),
            'alpha': np.expand_dims(alpha_chw.numpy(), 0),
            'lsb': np.expand_dims(lsb_chw.numpy(), 0),
            'palette': np.expand_dims(palette.numpy(), 0),
            'format_features': np.expand_dims(format_features.numpy(), 0),
            'content_features': np.expand_dims(content_features.numpy(), 0),
            'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32)  # Default msb-first
        }

        method = method or self._detect_method_from_filename(img_path)

        if self.task == "detect":
            if self.detector:
                try:
                    outputs = self.detector.run(None, inputs)
                    stego_logits = outputs[0]
                    method_logits = outputs[1]
                    method_id = outputs[2]
                    method_probs = outputs[3]

                    prob = float(1 / (1 + np.exp(-stego_logits[0][0])))  # Sigmoid
                    predicted_method = int(np.argmax(method_logits[0]))

                    return {
                        "image_path": img_path,
                        "stego_probability": prob,
                        "task": self.task,
                        "method": method,
                        "predicted_method_id": predicted_method,
                        "predicted": prob > 0.5
                    }
                except Exception as e:
                    return {"error": f"ONNX inference failed: {e}"}
            else:
                return {"error": "Detector model not loaded"}
        else:
            return {"error": f"Task '{self.task}' not supported in unified design"}


if ONNX_AVAILABLE and load_unified_input:
    class StarlightSteganographyDetectionPipeline:
        def __init__(self, model_path=None, config_path="config.json", **kwargs):
            # Load config
            if not os.path.exists(config_path):
                raise FileNotFoundError(f"Config file not found at {config_path}")
            with open(config_path, 'r') as f:
                self.config = json.load(f)

            if model_path is None:
                model_path = self.config.get("model_path", "models/detector_balanced.onnx")

            # Load ONNX model
            providers = []
            available_providers = ort.get_available_providers()
            if 'CUDAExecutionProvider' in available_providers:
                providers.append('CUDAExecutionProvider')
            if 'CoreMLExecutionProvider' in available_providers:
                providers.append('CoreMLExecutionProvider')
            providers.append('CPUExecutionProvider')

            session_options = ort.SessionOptions()
            if 'CUDAExecutionProvider' in providers:
                session_options.enable_mem_pattern = False
            elif 'CoreMLExecutionProvider' in providers:
                session_options.enable_mem_pattern = False

            if not os.path.exists(model_path):
                raise FileNotFoundError(f"Model not found at {model_path}")

            self.model = ort.InferenceSession(model_path, sess_options=session_options, providers=providers)

        def __call__(self, image_path, **kwargs):
            sanitized_kwargs, _, _ = self._sanitize_parameters(**kwargs)
            model_inputs = self.preprocess(image_path)
            model_outputs = self._forward(model_inputs)
            return self.postprocess(model_outputs)

        def _sanitize_parameters(self, **kwargs):
            # No specific parameters to sanitize for now
            return {}, {}, {}

        def preprocess(self, image_path):
            if not isinstance(image_path, str) or not os.path.exists(image_path):
                raise ValueError(f"Invalid image_path: {image_path}")

            # Use unified input loader
            try:
                pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(image_path, fast_mode=True)
            except Exception as e:
                raise ValueError(f"Failed to preprocess image {image_path}: {e}")

            # Convert to numpy for ONNX and add batch dimension
            # Note: lsb and alpha need to be in CHW format for ONNX
            lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb  # (3, 256, 256)
            alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha  # (1, 256, 256)

            model_inputs = {
                'meta': np.expand_dims(meta.numpy(), 0),
                'alpha': np.expand_dims(alpha_chw.numpy(), 0),
                'lsb': np.expand_dims(lsb_chw.numpy(), 0),
                'palette': np.expand_dims(palette.numpy(), 0),
                'format_features': np.expand_dims(format_features.numpy(), 0),
                'content_features': np.expand_dims(content_features.numpy(), 0),
                'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32) # Default msb-first
            }

            return model_inputs

        def _forward(self, model_inputs):
            try:
                outputs = self.model.run(None, model_inputs)
                return {
                    'stego_logits': outputs[0],
                    'method_logits': outputs[1],
                }
            except Exception as e:
                raise RuntimeError(f"ONNX inference failed: {e}")

        def postprocess(self, model_outputs):
            stego_logits = model_outputs['stego_logits']
            method_logits = model_outputs['method_logits']

            prob = float(1 / (1 + np.exp(-stego_logits[0][0]))) # Sigmoid
            
            method_probs = np.exp(method_logits[0]) / np.sum(np.exp(method_logits[0]))
            predicted_method_id = int(np.argmax(method_logits[0]))
            predicted_method_name = self.config["id2label"].get(str(predicted_method_id), "unknown")

            return {
                "stego_probability": prob,
                "predicted_method": predicted_method_name,
                "predicted_method_id": predicted_method_id,
                "predicted_method_prob": float(method_probs[predicted_method_id]),
                "is_steganography": prob > 0.5
            }

        def _sanitize_parameters(self, **kwargs):
            # No specific parameters to sanitize for now
            return {}, {}, {}

        def preprocess(self, image_path):
            if not isinstance(image_path, str) or not os.path.exists(image_path):
                raise ValueError(f"Invalid image_path: {image_path}")

            # Use unified input loader
            try:
                pixel_tensor, meta, alpha, lsb, palette, format_features, content_features = load_unified_input(image_path, fast_mode=True)
            except Exception as e:
                raise ValueError(f"Failed to preprocess image {image_path}: {e}")

            # Convert to numpy for ONNX and add batch dimension
            # Note: lsb and alpha need to be in CHW format for ONNX
            lsb_chw = lsb.permute(2, 0, 1) if lsb.dim() == 3 else lsb  # (3, 256, 256)
            alpha_chw = alpha.unsqueeze(0) if alpha.dim() == 2 else alpha  # (1, 256, 256)

            model_inputs = {
                'meta': np.expand_dims(meta.numpy(), 0),
                'alpha': np.expand_dims(alpha_chw.numpy(), 0),
                'lsb': np.expand_dims(lsb_chw.numpy(), 0),
                'palette': np.expand_dims(palette.numpy(), 0),
                'format_features': np.expand_dims(format_features.numpy(), 0),
                'content_features': np.expand_dims(content_features.numpy(), 0),
                'bit_order': np.array([[0.0, 1.0, 0.0]], dtype=np.float32) # Default msb-first
            }

            return model_inputs

        def _forward(self, model_inputs):
            try:
                outputs = self.model.run(None, model_inputs)
                return {
                    'stego_logits': outputs[0],
                    'method_logits': outputs[1],
                }
            except Exception as e:
                raise RuntimeError(f"ONNX inference failed: {e}")

        def postprocess(self, model_outputs):
            stego_logits = model_outputs['stego_logits']
            method_logits = model_outputs['method_logits']

            prob = float(1 / (1 + np.exp(-stego_logits[0][0]))) # Sigmoid
            
            method_probs = np.exp(method_logits[0]) / np.sum(np.exp(method_logits[0]))
            predicted_method_id = int(np.argmax(method_logits[0]))
            predicted_method_name = self.config["id2label"].get(str(predicted_method_id), "unknown")

            return {
                "stego_probability": prob,
                "predicted_method": predicted_method_name,
                "predicted_method_id": predicted_method_id,
                "predicted_method_prob": float(method_probs[predicted_method_id]),
                "is_steganography": prob > 0.5
            }

# Convenience functions for specific tasks
def detect_steganography(img_path):
    """Detect steganography using the unified model."""
    model = StarlightModel(task="detect")
    return model.predict(img_path)

def get_starlight_pipeline():
    """
    Initializes and returns the StarlightSteganographyDetectionPipeline.
    Raises ImportError if dependencies are not met.
    """
    if not ONNX_AVAILABLE:
        raise ImportError("ONNX runtime library not found. Please install it with 'pip install onnxruntime'.")
    if not load_unified_input:
        raise ImportError("starlight_utils could not be imported. Please ensure the 'scripts' directory is in your Python path.")
    
    return StarlightSteganographyDetectionPipeline()