Spaces:

Astridkraft
/

Test

Sleeping

App Files Files Community

Astridkraft commited on 17 days ago

Commit

914cfda

verified ·

1 Parent(s): aa82308

Update sam_module.py

Browse files

Files changed (1) hide show

sam_module.py +34 -15

sam_module.py CHANGED Viewed

@@ -682,41 +682,60 @@ def create_sam_mask(self, image, bbox_coords, mode):
             num_masks = outputs.pred_masks.shape[2]
             print(f"   SAM lieferte {num_masks} verschiedene Masken")
             # Extrahiere alle Masken
-            all_masks = []
             for i in range(num_masks):
                 single_mask = outputs.pred_masks[:, :, i, :, :]
-                resized_mask = F.interpolate(
                     single_mask,
-                    size=(image.height, image.width),
                     mode='bilinear',
                     align_corners=False
                 ).squeeze()
-                mask_np = resized_mask.sigmoid().cpu().numpy()
-                all_masks.append(mask_np)
-                # Basis-Statistiken für jede Maske
-                mask_binary = (mask_np > 0.5).astype(np.uint8)
-                mask_area = np.sum(mask_binary)
-                print(f"   Maske {i+1}: Größe={mask_area:,} Pixel, Max-Konfidenz={mask_np.max():.3f}")
             # ============================================================
             # HEURISTIK
             # ============================================================
             print("🤔 SCHRITT 6: MASKENAUSWAHL MIT MODUS-SPEZIFISCHER HEURISTIK")
-            bbox_center = ((x1 + x2) // 2, (y1 + y2) // 2)
-            bbox_area = (x2 - x1) * (y2 - y1)
-            print(f"   Erwartetes BBox-Zentrum: {bbox_center}")
-            print(f"   Erwartete BBox-Fläche: {bbox_area:,} Pixel")
             best_mask_idx = 0
             best_score = -1
-            for i, mask_np in enumerate(all_masks):
                 mask_max = mask_np.max()
                 # Grundlegende Filterung

             num_masks = outputs.pred_masks.shape[2]
             print(f"   SAM lieferte {num_masks} verschiedene Masken")
+            #============
+            #Doppelte  Berechnung: CROP und Original damit Heuristik
+            # auf Original berechnet werden kann und Weiterverarbeitung auf Crop
+            #==============
             # Extrahiere alle Masken
+            all_masks_crop = []
+            all_masks_original = []
             for i in range(num_masks):
                 single_mask = outputs.pred_masks[:, :, i, :, :]
+                #Für Heuristik SAM-Masken auf Original-Bildgröße
+                resized_mask_original = F.interpolate(
                     single_mask,
+                    size=(original_image.height, original_image.width),
                     mode='bilinear',
                     align_corners=False
                 ).squeeze()
+                mask_np_original = resized_mask_original.sigmoid().cpu().numpy()
+                all_masks_original.append(mask_np_original)
+                # 2. FÜR VERARBEITUNG: Auf CROP-GRÖSSE interpolieren
+                resized_mask_crop = F.interpolate(
+                    single_mask,
+                    size=(image.height, image.width),  # CROP-Größe!
+                    mode='bilinear',
+                    align_corners=False
+                ).squeeze()
+                mask_np_crop = resized_mask_crop.sigmoid().cpu().numpy()
+                all_masks_crop.append(mask_np_crop)
+                # Debug-Info
+                mask_binary_crop = (mask_np_crop > 0.5).astype(np.uint8)
+                mask_binary_original = (mask_np_original > 0.5).astype(np.uint8)
+                print(f"   Maske {i+1}: Crop={np.sum(mask_binary_crop):,}px, "
+                      f"Original={np.sum(mask_binary_original):,}px")
             # ============================================================
             # HEURISTIK
             # ============================================================
             print("🤔 SCHRITT 6: MASKENAUSWAHL MIT MODUS-SPEZIFISCHER HEURISTIK")
+            bbox_center = ((original_bbox[0] + original_bbox[2]) // 2,
+                           (original_bbox[1] + original_bbox[3]) // 2)
+            bbox_area = (original_bbox[2] - original_bbox[0]) * (original_bbox[3] - original_bbox[1])
             best_mask_idx = 0
             best_score = -1
+            for i, mask_np in enumerate(all_masks_original):
                 mask_max = mask_np.max()
                 # Grundlegende Filterung