TerenceG
/

handler_AI_detection_v3

Model card Files Files and versions

xet

Community

TerenceG commited on Jul 22, 2025

Commit

424c6c7

verified ·

1 Parent(s): 9ad2cff

Create handler.py

Browse files

Files changed (1) hide show

handler.py +320 -0

handler.py ADDED Viewed

	@@ -0,0 +1,320 @@

+from typing import Any, Dict
+import torch
+from torchvision import transforms
+from PIL import Image
+import base64
+import io
+import numpy as np
+from transformers import AutoModelForImageClassification, AutoImageProcessor
+from pytorch_grad_cam import GradCAM
+from pytorch_grad_cam.utils.image import show_cam_on_image
+import warnings
+warnings.filterwarnings("ignore")
+class EndpointHandler:
+    def __init__(self, model_dir: str = "haywoodsloan/ai-image-detector-deploy", **kwargs: Any):
+        """
+        Initialise le handler avec le modèle haywoodsloan/ai-image-detector-deploy
+        et configure Grad-CAM pour les cartes de saillance.
+        """
+        print(f"Initialisation du handler avec le modèle : {model_dir}")
+        # Charger le modèle et le processeur
+        self.model = AutoModelForImageClassification.from_pretrained(model_dir)
+        self.model.eval()
+        self.processor = AutoImageProcessor.from_pretrained(model_dir)
+        # Configuration de Grad-CAM - Adaptation pour différentes architectures
+        # Le modèle haywoodsloan/ai-image-detector-deploy est généralement basé sur ViT ou CNN
+        self.target_layer = self._find_target_layer()
+        self.cam = GradCAM(
+            model=self.model,
+            target_layers=[self.target_layer]
+        )
+        # Mapping des classes pour le détecteur d'IA
+        # Configuration basée sur la structure du modèle haywoodsloan
+        self.class_names = {
+            0: "Image Réelle",
+            1: "Image Générée par IA"
+        }
+        # Seuils de confiance pour l'interprétation
+        self.confidence_thresholds = {
+            "très_élevée": 0.9,
+            "élevée": 0.75,
+            "moyenne": 0.6,
+            "faible": 0.4
+        }
+        print("Handler initialisé avec succès!")
+    def _find_target_layer(self):
+        """
+        Trouve automatiquement la couche cible appropriée pour Grad-CAM
+        selon l'architecture du modèle.
+        """
+        try:
+            # Pour les modèles Vision Transformer (ViT)
+            if hasattr(self.model, 'vit'):
+                if hasattr(self.model.vit, 'encoder'):
+                    return self.model.vit.encoder.layer[-1].layernorm_before
+                elif hasattr(self.model.vit, 'layers'):
+                    return self.model.vit.layers[-1].norm1
+            # Pour les modèles Swin Transformer
+            elif hasattr(self.model, 'swin'):
+                return self.model.swin.encoder.layers[-1].blocks[-1].layernorm_before
+            # Pour les modèles avec backbone
+            elif hasattr(self.model, 'backbone'):
+                if hasattr(self.model.backbone, 'layers'):
+                    return self.model.backbone.layers[-1].blocks[-1].norm1
+                else:
+                    # Fallback pour backbone CNN
+                    return list(self.model.backbone.children())[-2]
+            # Pour les modèles ConvNeXt
+            elif hasattr(self.model, 'convnext'):
+                return self.model.convnext.encoder.stages[-1].layers[-1].layernorm
+            # Pour les modèles ResNet ou autres architectures CNN
+            elif hasattr(self.model, 'resnet'):
+                return self.model.resnet.layer4[-1].bn2
+            # Fallback générique - chercher la dernière couche de normalisation
+            else:
+                # Parcourir tous les modules pour trouver une couche appropriée
+                modules = list(self.model.named_modules())
+                for name, module in reversed(modules):
+                    if any(layer_type in name.lower() for layer_type in ['layernorm', 'batchnorm', 'norm']):
+                        if 'classifier' not in name.lower():
+                            print(f"Couche cible trouvée : {name}")
+                            return module
+                # Si aucune couche de normalisation trouvée, utiliser l'avant-dernière couche
+                children = list(self.model.children())
+                if len(children) > 1:
+                    return children[-2]
+                else:
+                    return children[-1]
+        except Exception as e:
+            print(f"Erreur lors de la recherche de la couche cible: {e}")
+            # Fallback final - utiliser la première couche trouvée
+            children = list(self.model.children())
+            return children[-2] if len(children) > 1 else children[0]
+    def _interpret_confidence(self, confidence: float, predicted_class: str) -> str:
+        """
+        Interprète le niveau de confiance et génère un message explicatif.
+        """
+        if confidence >= self.confidence_thresholds["très_élevée"]:
+            level = "très élevée"
+            reliability = "Très fiable"
+        elif confidence >= self.confidence_thresholds["élevée"]:
+            level = "élevée"
+            reliability = "Fiable"
+        elif confidence >= self.confidence_thresholds["moyenne"]:
+            level = "moyenne"
+            reliability = "Moyennement fiable"
+        else:
+            level = "faible"
+            reliability = "Peu fiable"
+        interpretation = f"Confiance {level} ({confidence:.1%}) - {reliability}. "
+        if predicted_class == "Image Générée par IA":
+            if confidence >= 0.8:
+                interpretation += "L'image présente des caractéristiques typiques d'une génération par IA."
+            elif confidence >= 0.6:
+                interpretation += "L'image pourrait être générée par IA, mais nécessite une vérification supplémentaire."
+            else:
+                interpretation += "Classification incertaine - analyse manuelle recommandée."
+        else:
+            if confidence >= 0.8:
+                interpretation += "L'image semble authentique avec des caractéristiques naturelles."
+            elif confidence >= 0.6:
+                interpretation += "L'image semble réelle, mais avec quelques éléments à vérifier."
+            else:
+                interpretation += "Classification incertaine - analyse manuelle recommandée."
+        return interpretation
+    def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
+        """
+        Traite une image et retourne la prédiction avec la carte de saillance.
+        Args:
+            data: Dictionnaire contenant l'image encodée en base64
+        Returns:
+            Dictionnaire avec la prédiction, confiance et carte de saillance
+        """
+        try:
+            print("Début du traitement de l'image...")
+            # Décoder l'image depuis une chaîne base64
+            if isinstance(data["inputs"], str):
+                image_data = base64.b64decode(data["inputs"])
+            else:
+                # Si c'est déjà des bytes
+                image_data = data["inputs"]
+            image = Image.open(io.BytesIO(image_data)).convert("RGB")
+            print(f"Image chargée avec succès : {image.size}")
+            # Préprocesser l'image pour le modèle
+            inputs = self.processor(images=image, return_tensors="pt")
+            input_tensor = inputs["pixel_values"]
+            print("Génération de la carte de saillance Grad-CAM...")
+            # Générer la carte de saillance avec Grad-CAM
+            try:
+                # Correction spécifique pour Swin Transformer v2
+                # Créer une classe wrapper pour le modèle
+                import torch.nn as nn
+                class ModelWrapper(nn.Module):
+                    def __init__(self, model):
+                        super().__init__()
+                        self.model = model
+                    def forward(self, x):
+                        outputs = self.model(x)
+                        # Extraire les logits des outputs de Swin v2
+                        return outputs.logits
+                # Créer le wrapper
+                wrapped_model = ModelWrapper(self.model)
+                # Créer un nouveau GradCAM avec le modèle wrapper
+                from pytorch_grad_cam import GradCAM
+                from pytorch_grad_cam.utils.model_targets import ClassifierOutputTarget
+                wrapped_cam = GradCAM(
+                    model=wrapped_model,
+                    target_layers=[self.target_layer]
+                )
+                # Obtenir la classe prédite
+                with torch.no_grad():
+                    outputs = self.model(input_tensor)
+                    predicted_class_idx = torch.argmax(outputs.logits, dim=1).item()
+                # Créer le target pour GradCAM
+                targets = [ClassifierOutputTarget(predicted_class_idx)]
+                # Générer la carte de saillance
+                grayscale_cam = wrapped_cam(input_tensor=input_tensor, targets=targets)[0]
+                # Redimensionner l'image originale pour correspondre à la carte de saillance
+                cam_height, cam_width = grayscale_cam.shape
+                image_resized = image.resize((cam_width, cam_height))
+                image_np = np.array(image_resized).astype(np.float32) / 255.0
+                # Superposer la carte de chaleur sur l'image
+                visualization = show_cam_on_image(image_np, grayscale_cam, use_rgb=True)
+                # Convertir la carte de chaleur en base64
+                buffered = io.BytesIO()
+                Image.fromarray(visualization).save(buffered, format="PNG")
+                cam_image_base64 = base64.b64encode(buffered.getvalue()).decode("utf-8")
+            except Exception as e:
+                print(f"Erreur lors de la génération de Grad-CAM: {e}")
+                cam_image_base64 = None
+            print("Exécution de la prédiction...")
+            # Obtenir la prédiction du modèle
+            with torch.no_grad():
+                outputs = self.model(**inputs)
+                logits = outputs.logits
+                probabilities = torch.nn.functional.softmax(logits, dim=1)
+                predicted_class = torch.argmax(probabilities, dim=1).item()
+                confidence = probabilities[0][predicted_class].item()
+            # Calculer le score de confiance pour chaque classe
+            class_probabilities = {}
+            for i, prob in enumerate(probabilities[0].tolist()):
+                class_name = self.class_names.get(i, f"Classe {i}")
+                class_probabilities[class_name] = round(prob, 4)
+            # Générer l'interprétation
+            predicted_class_name = self.class_names.get(predicted_class, f"Classe {predicted_class}")
+            interpretation = self._interpret_confidence(confidence, predicted_class_name)
+            # Score de détection d'IA (probabilité que ce soit une IA)
+            ai_detection_score = probabilities[0][1].item() if len(probabilities[0]) > 1 else 0.0
+            result = {
+                "prediction": predicted_class,
+                "predicted_class_name": predicted_class_name,
+                "confidence": round(confidence, 4),
+                "ai_detection_score": round(ai_detection_score, 4),
+                "class_probabilities": class_probabilities,
+                "interpretation": interpretation,
+                "status": "success",
+                "model_used": "haywoodsloan/ai-image-detector-deploy"
+            }
+            # Ajouter la carte Grad-CAM si disponible
+            if cam_image_base64:
+                result["cam_image"] = cam_image_base64
+                result["grad_cam_available"] = True
+            else:
+                result["grad_cam_available"] = False
+                result["grad_cam_error"] = "Impossible de générer la carte de saillance"
+            print(f"Traitement terminé avec succès! Prédiction: {predicted_class_name}, Confiance: {confidence:.2%}")
+            return result
+        except Exception as e:
+            print(f"Erreur lors du traitement: {e}")
+            return {
+                "error": str(e),
+                "status": "error",
+                "model_used": "haywoodsloan/ai-image-detector-deploy"
+            }
+# Test local du handler (optionnel)
+if __name__ == "__main__":
+    import os
+    try:
+        print("Test d'initialisation du handler...")
+        handler = EndpointHandler()
+        print("Handler initialisé avec succès!")
+        # Test avec une image d'exemple
+        test_image_path = "test_image.jpg"
+        if os.path.exists(test_image_path):
+            print(f"Test avec l'image : {test_image_path}")
+            with open(test_image_path, "rb") as f:
+                image_bytes = f.read()
+            input_data = {"inputs": base64.b64encode(image_bytes).decode("utf-8")}
+            output = handler(input_data)
+            print("\n=== RÉSULTATS DU TEST ===")
+            print(f"Statut: {output.get('status', 'N/A')}")
+            print(f"Prédiction: {output.get('predicted_class_name', 'N/A')}")
+            print(f"Confiance: {output.get('confidence', 0):.2%}")
+            print(f"Score de détection IA: {output.get('ai_detection_score', 0):.2%}")
+            print(f"Grad-CAM disponible: {output.get('grad_cam_available', False)}")
+            print(f"Interprétation: {output.get('interpretation', 'N/A')}")
+            if 'class_probabilities' in output:
+                print("\nProbabilités par classe:")
+                for class_name, prob in output['class_probabilities'].items():
+                    print(f"  {class_name}: {prob:.2%}")
+        else:
+            print(f"Aucune image de test trouvée : {test_image_path}")
+            print("Placez une image de test dans le répertoire pour tester le handler.")
+            print("Vous pouvez utiliser n'importe quel format d'image (JPG, PNG, etc.)")
+    except Exception as e:
+        print(f"Erreur lors de l'initialisation ou du test: {e}")
+        import traceback
+        traceback.print_exc()