Spaces:

MogensR
/

VideoBackgroundReplacer2

Paused

App Files Files Community

MogensR commited on Oct 2, 2025

Commit

01d284f

verified ·

1 Parent(s): 77b93ef

Update models/sam2_loader.py

Browse files

Files changed (1) hide show

models/sam2_loader.py +55 -70

models/sam2_loader.py CHANGED Viewed

@@ -3,6 +3,7 @@
 SAM2 Loader with Hugging Face Hub integration
 Provides SAM2Predictor class with memory management and optimization features
 Updated to use Hugging Face Hub models instead of direct downloads
 """
 import os
@@ -13,6 +14,7 @@
 from pathlib import Path
 from typing import Optional, Any, Dict, List, Tuple
 logger = logging.getLogger(__name__)
 class SAM2Predictor:
@@ -21,6 +23,7 @@ class SAM2Predictor:
     """
     def __init__(self, device: torch.device, model_size: str = "small"):
         self.device = device
         self.model_size = model_size
         self.predictor = None
@@ -30,73 +33,60 @@ def __init__(self, device: torch.device, model_size: str = "small"):
     def _load_predictor(self):
         """Load SAM2 predictor with Hugging Face Hub integration"""
         try:
             from sam2.build_sam import build_sam2_video_predictor
-            # Get checkpoint from Hugging Face Hub
             checkpoint_path = self._get_hf_checkpoint()
             if not checkpoint_path:
                 raise RuntimeError(f"Failed to get SAM2 {self.model_size} checkpoint from HF Hub")
-            # Get model config
             model_cfg = self._get_model_config()
-            # Build predictor
             self.predictor = build_sam2_video_predictor(model_cfg, checkpoint_path, device=self.device)
-            # Apply T4 optimizations
             self._optimize_for_t4()
             logger.info(f"SAM2 {self.model_size} predictor loaded successfully from HF Hub")
         except ImportError as e:
             logger.error(f"SAM2 import failed: {e}")
             raise RuntimeError("SAM2 not available - check sam2 installation")
         except Exception as e:
-            logger.error(f"SAM2 loading failed: {e}")
             raise
     def _get_hf_checkpoint(self) -> Optional[str]:
         """Download checkpoint from Hugging Face Hub"""
         try:
             from huggingface_hub import hf_hub_download
-            # Repository mapping for different model sizes
             repo_mapping = {
                 "small": "facebook/sam2-hiera-small",
                 "base": "facebook/sam2-hiera-base-plus",
                 "large": "facebook/sam2-hiera-large"
             }
             filename_mapping = {
                 "small": "sam2_hiera_small.pt",
                 "base": "sam2_hiera_base_plus.pt",
                 "large": "sam2_hiera_large.pt"
             }
             if self.model_size not in repo_mapping:
                 logger.error(f"Unknown model size: {self.model_size}")
                 return None
             repo_id = repo_mapping[self.model_size]
             filename = filename_mapping[self.model_size]
             logger.info(f"Downloading SAM2 {self.model_size} from HF Hub: {repo_id}")
-            # Download from Hugging Face Hub
             checkpoint_path = hf_hub_download(
                 repo_id=repo_id,
                 filename=filename,
-                cache_dir=None,  # Use default cache
-                force_download=False,  # Use cached version if available
-                token=None  # No auth token needed for public models
             )
             logger.info(f"SAM2 checkpoint downloaded to: {checkpoint_path}")
             return checkpoint_path
         except Exception as e:
             logger.error(f"HF Hub download failed: {e}")
-            # Fallback to local checkpoint if HF download fails
             return self._fallback_local_checkpoint()
     def _fallback_local_checkpoint(self) -> Optional[str]:
@@ -120,63 +110,64 @@ def _get_model_config(self) -> str:
             "base": "sam2_hiera_b+.yaml",
             "large": "sam2_hiera_l.yaml"
         }
-        return config_mapping.get(self.model_size, "sam2_hiera_s.yaml")
     def _optimize_for_t4(self):
         """Apply T4-specific optimizations"""
         try:
             if hasattr(self.predictor, "model") and self.predictor.model is not None:
                 self.model = self.predictor.model
-                # Apply fp16 and channels_last for T4 efficiency
                 self.model = self.model.half().to(self.device)
                 self.model = self.model.to(memory_format=torch.channels_last)
                 logger.info("SAM2: fp16 + channels_last applied for T4 optimization")
         except Exception as e:
-            logger.warning(f"SAM2 T4 optimization warning: {e}")
     def init_state(self, video_path: str):
-        """Initialize video processing state"""
         if self.predictor is None:
             raise RuntimeError("Predictor not loaded")
         try:
-            return self.predictor.init_state(video_path=video_path)
         except Exception as e:
-            logger.error(f"Failed to initialize video state: {e}")
             raise
     def add_new_points(self, inference_state, frame_idx: int, obj_id: int,
                       points: np.ndarray, labels: np.ndarray):
-        """Add new points for tracking"""
         if self.predictor is None:
             raise RuntimeError("Predictor not loaded")
         try:
-            return self.predictor.add_new_points(
                 inference_state=inference_state,
                 frame_idx=frame_idx,
                 obj_id=obj_id,
                 points=points,
                 labels=labels
             )
         except Exception as e:
-            logger.error(f"Failed to add new points: {e}")
             raise
     def add_new_points_or_box(self, inference_state, frame_idx: int, obj_id: int,
                              points: np.ndarray, labels: np.ndarray, clear_old_points: bool = True):
-        """Add new points or box for tracking (newer SAM2 API)"""
         if self.predictor is None:
             raise RuntimeError("Predictor not loaded")
         try:
-            # Try the newer API first
             if hasattr(self.predictor, 'add_new_points_or_box'):
-                return self.predictor.add_new_points_or_box(
                     inference_state=inference_state,
                     frame_idx=frame_idx,
                     obj_id=obj_id,
@@ -184,38 +175,39 @@ def add_new_points_or_box(self, inference_state, frame_idx: int, obj_id: int,
                     labels=labels,
                     clear_old_points=clear_old_points
                 )
             else:
-                # Fallback to older API
-                return self.predictor.add_new_points(
                     inference_state=inference_state,
                     frame_idx=frame_idx,
                     obj_id=obj_id,
                     points=points,
                     labels=labels
                 )
         except Exception as e:
-            logger.error(f"Failed to add new points or box: {e}")
             raise
     def propagate_in_video(self, inference_state, scale: float = 1.0, **kwargs):
-        """Propagate through video with optional scaling"""
         if self.predictor is None:
             raise RuntimeError("Predictor not loaded")
         try:
-            # Use the predictor's propagate_in_video method
-            return self.predictor.propagate_in_video(inference_state, **kwargs)
         except Exception as e:
-            logger.error(f"Failed to propagate in video: {e}")
             raise
     def prune_state(self, inference_state, keep: int):
-        """Prune SAM2 state to keep only recent frames in memory"""
         try:
-            # Try to access and prune internal caches
-            # This is model-specific and may need adjustment based on SAM2 internals
             if hasattr(inference_state, 'cached_features'):
-                # Keep only the most recent 'keep' frames
                 cached_keys = list(inference_state.cached_features.keys())
                 if len(cached_keys) > keep:
                     keys_to_remove = cached_keys[:-keep]
@@ -223,26 +215,20 @@ def prune_state(self, inference_state, keep: int):
                         if key in inference_state.cached_features:
                             del inference_state.cached_features[key]
                     logger.debug(f"Pruned {len(keys_to_remove)} old cached features")
-            # Clear other potential caches
             if hasattr(inference_state, 'point_inputs_per_obj'):
-                # Keep recent point inputs only
                 for obj_id in list(inference_state.point_inputs_per_obj.keys()):
                     obj_inputs = inference_state.point_inputs_per_obj[obj_id]
                     if len(obj_inputs) > keep:
-                        # Keep only recent entries
                         recent_keys = sorted(obj_inputs.keys())[-keep:]
                         new_inputs = {k: obj_inputs[k] for k in recent_keys}
                         inference_state.point_inputs_per_obj[obj_id] = new_inputs
-            # Force garbage collection
-            torch.cuda.empty_cache() if self.device.type == 'cuda' else None
         except Exception as e:
-            logger.debug(f"State pruning warning: {e}")
     def clear_memory(self):
-        """Clear GPU memory aggressively"""
         try:
             if self.device.type == 'cuda':
                 torch.cuda.empty_cache()
@@ -250,35 +236,34 @@ def clear_memory(self):
                 torch.cuda.ipc_collect()
             gc.collect()
         except Exception as e:
-            logger.warning(f"Memory clearing warning: {e}")
     def get_memory_usage(self) -> Dict[str, float]:
-        """Get current memory usage statistics"""
         if self.device.type != 'cuda':
             return {"allocated_gb": 0.0, "reserved_gb": 0.0, "free_gb": 0.0}
         try:
             allocated = torch.cuda.memory_allocated(self.device) / (1024**3)
             reserved = torch.cuda.memory_reserved(self.device) / (1024**3)
             free, total = torch.cuda.mem_get_info(self.device)
             free_gb = free / (1024**3)
             return {
                 "allocated_gb": allocated,
                 "reserved_gb": reserved,
                 "free_gb": free_gb,
                 "total_gb": total / (1024**3)
             }
-        except Exception:
             return {"allocated_gb": 0.0, "reserved_gb": 0.0, "free_gb": 0.0}
     def __del__(self):
-        """Cleanup on deletion"""
         try:
             if hasattr(self, 'predictor') and self.predictor is not None:
                 del self.predictor
             if hasattr(self, 'model') and self.model is not None:
                 del self.model
             self.clear_memory()
-        except Exception:
-            pass

 SAM2 Loader with Hugging Face Hub integration
 Provides SAM2Predictor class with memory management and optimization features
 Updated to use Hugging Face Hub models instead of direct downloads
+(Enhanced logging and exception safety)
 """
 import os
 from pathlib import Path
 from typing import Optional, Any, Dict, List, Tuple
+logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 class SAM2Predictor:
     """
     def __init__(self, device: torch.device, model_size: str = "small"):
+        logger.info(f"[SAM2Predictor.__init__] device={device}, model_size={model_size}")  # [LOG+SAFETY PATCH]
         self.device = device
         self.model_size = model_size
         self.predictor = None
     def _load_predictor(self):
         """Load SAM2 predictor with Hugging Face Hub integration"""
         try:
+            logger.info("[SAM2Predictor._load_predictor] Loading SAM2 predictor...")  # [LOG+SAFETY PATCH]
             from sam2.build_sam import build_sam2_video_predictor
             checkpoint_path = self._get_hf_checkpoint()
             if not checkpoint_path:
+                logger.error(f"Failed to get SAM2 {self.model_size} checkpoint from HF Hub")  # [LOG+SAFETY PATCH]
                 raise RuntimeError(f"Failed to get SAM2 {self.model_size} checkpoint from HF Hub")
             model_cfg = self._get_model_config()
+            logger.info(f"[SAM2Predictor._load_predictor] Using model_cfg: {model_cfg}")  # [LOG+SAFETY PATCH]
             self.predictor = build_sam2_video_predictor(model_cfg, checkpoint_path, device=self.device)
             self._optimize_for_t4()
             logger.info(f"SAM2 {self.model_size} predictor loaded successfully from HF Hub")
         except ImportError as e:
             logger.error(f"SAM2 import failed: {e}")
             raise RuntimeError("SAM2 not available - check sam2 installation")
         except Exception as e:
+            logger.error(f"SAM2 loading failed: {e}", exc_info=True)
             raise
     def _get_hf_checkpoint(self) -> Optional[str]:
         """Download checkpoint from Hugging Face Hub"""
         try:
+            logger.info(f"[SAM2Predictor._get_hf_checkpoint] Downloading checkpoint...")  # [LOG+SAFETY PATCH]
             from huggingface_hub import hf_hub_download
             repo_mapping = {
                 "small": "facebook/sam2-hiera-small",
                 "base": "facebook/sam2-hiera-base-plus",
                 "large": "facebook/sam2-hiera-large"
             }
             filename_mapping = {
                 "small": "sam2_hiera_small.pt",
                 "base": "sam2_hiera_base_plus.pt",
                 "large": "sam2_hiera_large.pt"
             }
             if self.model_size not in repo_mapping:
                 logger.error(f"Unknown model size: {self.model_size}")
                 return None
             repo_id = repo_mapping[self.model_size]
             filename = filename_mapping[self.model_size]
             logger.info(f"Downloading SAM2 {self.model_size} from HF Hub: {repo_id}")
             checkpoint_path = hf_hub_download(
                 repo_id=repo_id,
                 filename=filename,
+                cache_dir=None,
+                force_download=False,
+                token=None
             )
             logger.info(f"SAM2 checkpoint downloaded to: {checkpoint_path}")
             return checkpoint_path
         except Exception as e:
             logger.error(f"HF Hub download failed: {e}")
             return self._fallback_local_checkpoint()
     def _fallback_local_checkpoint(self) -> Optional[str]:
             "base": "sam2_hiera_b+.yaml",
             "large": "sam2_hiera_l.yaml"
         }
+        cfg = config_mapping.get(self.model_size, "sam2_hiera_s.yaml")
+        logger.info(f"[SAM2Predictor._get_model_config] Returning config: {cfg}")  # [LOG+SAFETY PATCH]
+        return cfg
     def _optimize_for_t4(self):
         """Apply T4-specific optimizations"""
         try:
+            logger.info("[SAM2Predictor._optimize_for_t4] Optimizing for T4...")  # [LOG+SAFETY PATCH]
             if hasattr(self.predictor, "model") and self.predictor.model is not None:
                 self.model = self.predictor.model
                 self.model = self.model.half().to(self.device)
                 self.model = self.model.to(memory_format=torch.channels_last)
                 logger.info("SAM2: fp16 + channels_last applied for T4 optimization")
         except Exception as e:
+            logger.warning(f"SAM2 T4 optimization warning: {e}", exc_info=True)
     def init_state(self, video_path: str):
+        logger.info(f"[SAM2Predictor.init_state] Initializing video state for: {video_path}")  # [LOG+SAFETY PATCH]
         if self.predictor is None:
+            logger.error("Predictor not loaded in init_state")
             raise RuntimeError("Predictor not loaded")
         try:
+            state = self.predictor.init_state(video_path=video_path)
+            logger.info("[SAM2Predictor.init_state] Video state initialized OK")
+            return state
         except Exception as e:
+            logger.error(f"Failed to initialize video state: {e}", exc_info=True)
             raise
     def add_new_points(self, inference_state, frame_idx: int, obj_id: int,
                       points: np.ndarray, labels: np.ndarray):
+        logger.info(f"[SAM2Predictor.add_new_points] Adding points for frame {frame_idx}, obj {obj_id}")  # [LOG+SAFETY PATCH]
         if self.predictor is None:
+            logger.error("Predictor not loaded in add_new_points")
             raise RuntimeError("Predictor not loaded")
         try:
+            out = self.predictor.add_new_points(
                 inference_state=inference_state,
                 frame_idx=frame_idx,
                 obj_id=obj_id,
                 points=points,
                 labels=labels
             )
+            logger.info(f"[SAM2Predictor.add_new_points] Points added OK")
+            return out
         except Exception as e:
+            logger.error(f"Failed to add new points: {e}", exc_info=True)
             raise
     def add_new_points_or_box(self, inference_state, frame_idx: int, obj_id: int,
                              points: np.ndarray, labels: np.ndarray, clear_old_points: bool = True):
+        logger.info(f"[SAM2Predictor.add_new_points_or_box] Adding points/box for frame {frame_idx}, obj {obj_id}")  # [LOG+SAFETY PATCH]
         if self.predictor is None:
+            logger.error("Predictor not loaded in add_new_points_or_box")
             raise RuntimeError("Predictor not loaded")
         try:
             if hasattr(self.predictor, 'add_new_points_or_box'):
+                out = self.predictor.add_new_points_or_box(
                     inference_state=inference_state,
                     frame_idx=frame_idx,
                     obj_id=obj_id,
                     labels=labels,
                     clear_old_points=clear_old_points
                 )
+                logger.info(f"[SAM2Predictor.add_new_points_or_box] Used new API, points/box added OK")
+                return out
             else:
+                out = self.predictor.add_new_points(
                     inference_state=inference_state,
                     frame_idx=frame_idx,
                     obj_id=obj_id,
                     points=points,
                     labels=labels
                 )
+                logger.info(f"[SAM2Predictor.add_new_points_or_box] Used fallback, points added OK")
+                return out
         except Exception as e:
+            logger.error(f"Failed to add new points or box: {e}", exc_info=True)
             raise
     def propagate_in_video(self, inference_state, scale: float = 1.0, **kwargs):
+        logger.info(f"[SAM2Predictor.propagate_in_video] Propagating in video...")  # [LOG+SAFETY PATCH]
         if self.predictor is None:
+            logger.error("Predictor not loaded in propagate_in_video")
             raise RuntimeError("Predictor not loaded")
         try:
+            out = self.predictor.propagate_in_video(inference_state, **kwargs)
+            logger.info(f"[SAM2Predictor.propagate_in_video] Propagation OK")
+            return out
         except Exception as e:
+            logger.error(f"Failed to propagate in video: {e}", exc_info=True)
             raise
     def prune_state(self, inference_state, keep: int):
+        logger.info(f"[SAM2Predictor.prune_state] Pruning state to keep {keep} frames...")  # [LOG+SAFETY PATCH]
         try:
             if hasattr(inference_state, 'cached_features'):
                 cached_keys = list(inference_state.cached_features.keys())
                 if len(cached_keys) > keep:
                     keys_to_remove = cached_keys[:-keep]
                         if key in inference_state.cached_features:
                             del inference_state.cached_features[key]
                     logger.debug(f"Pruned {len(keys_to_remove)} old cached features")
             if hasattr(inference_state, 'point_inputs_per_obj'):
                 for obj_id in list(inference_state.point_inputs_per_obj.keys()):
                     obj_inputs = inference_state.point_inputs_per_obj[obj_id]
                     if len(obj_inputs) > keep:
                         recent_keys = sorted(obj_inputs.keys())[-keep:]
                         new_inputs = {k: obj_inputs[k] for k in recent_keys}
                         inference_state.point_inputs_per_obj[obj_id] = new_inputs
+            if self.device.type == 'cuda':
+                torch.cuda.empty_cache()
         except Exception as e:
+            logger.debug(f"State pruning warning: {e}", exc_info=True)
     def clear_memory(self):
+        logger.info("[SAM2Predictor.clear_memory] Clearing GPU memory")  # [LOG+SAFETY PATCH]
         try:
             if self.device.type == 'cuda':
                 torch.cuda.empty_cache()
                 torch.cuda.ipc_collect()
             gc.collect()
         except Exception as e:
+            logger.warning(f"Memory clearing warning: {e}", exc_info=True)
     def get_memory_usage(self) -> Dict[str, float]:
+        logger.info("[SAM2Predictor.get_memory_usage] Checking memory usage")  # [LOG+SAFETY PATCH]
         if self.device.type != 'cuda':
             return {"allocated_gb": 0.0, "reserved_gb": 0.0, "free_gb": 0.0}
         try:
             allocated = torch.cuda.memory_allocated(self.device) / (1024**3)
             reserved = torch.cuda.memory_reserved(self.device) / (1024**3)
             free, total = torch.cuda.mem_get_info(self.device)
             free_gb = free / (1024**3)
             return {
                 "allocated_gb": allocated,
                 "reserved_gb": reserved,
                 "free_gb": free_gb,
                 "total_gb": total / (1024**3)
             }
+        except Exception as e:
+            logger.warning(f"Error checking memory usage: {e}", exc_info=True)
             return {"allocated_gb": 0.0, "reserved_gb": 0.0, "free_gb": 0.0}
     def __del__(self):
+        logger.info("[SAM2Predictor.__del__] Cleaning up...")  # [LOG+SAFETY PATCH]
         try:
             if hasattr(self, 'predictor') and self.predictor is not None:
                 del self.predictor
             if hasattr(self, 'model') and self.model is not None:
                 del self.model
             self.clear_memory()
+        except Exception as e:
+            logger.warning(f"Error in __del__: {e}", exc_info=True)