Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

README.md +16 -0
assets/tokenizer/merges.txt +0 -0
assets/tokenizer/vocabulary.json +0 -0
config.json +196 -0
image_converter.json +36 -0
metadata.json +9 -0
model.weights.h5 +3 -0
preprocessor.json +77 -0
tokenizer.json +20 -0

README.md ADDED Viewed

	@@ -0,0 +1,16 @@

+---
+library_name: keras-hub
+---
+This is a [`SAM3PromptableConcept` model](https://keras.io/api/keras_hub/models/sam3_promptable_concept) uploaded using the KerasHub library and can be used with JAX, TensorFlow, and PyTorch backends.
+Model config:
+* **name:** sam3_promptable_concept_backbone
+* **trainable:** True
+* **dtype:** {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}
+* **vision_encoder:** {'module': 'keras_hub.src.models.sam3.sam3_vision_encoder', 'class_name': 'SAM3VisionEncoder', 'config': {'name': 'sam3_vision_encoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'image_shape': [1008, 1008, 3], 'patch_size': 14, 'num_layers': 32, 'hidden_dim': 1024, 'intermediate_dim': 4736, 'num_heads': 16, 'fpn_hidden_dim': 256, 'fpn_scale_factors': [4.0, 2.0, 1.0, 0.5], 'pretrain_image_shape': [336, 336, 3], 'hidden_activation': 'gelu', 'rope_theta': 10000.0, 'window_size': 24, 'global_attn_indexes': [7, 15, 23, 31], 'attention_dropout_rate': 0.0, 'hidden_dropout_rate': 0.0, 'layer_norm_epsilon': 1e-06}, 'registered_name': 'keras_hub>SAM3VisionEncoder'}
+* **text_encoder:** {'module': 'keras_hub.src.models.sam3.sam3_text_encoder', 'class_name': 'SAM3TextEncoder', 'config': {'name': 'sam3_text_encoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'vocabulary_size': 49408, 'embedding_dim': 1024, 'hidden_dim': 1024, 'num_layers': 24, 'num_heads': 16, 'intermediate_dim': 4096, 'intermediate_activation': 'gelu', 'max_sequence_length': 32, 'layer_norm_epsilon': 1e-05}, 'registered_name': 'keras_hub>SAM3TextEncoder'}
+* **geometry_encoder:** {'module': 'keras_hub.src.models.sam3.sam3_geometry_encoder', 'class_name': 'SAM3GeometryEncoder', 'config': {'name': 'sam3_geometry_encoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'num_layers': 3, 'hidden_dim': 256, 'intermediate_dim': 2048, 'num_heads': 8, 'roi_size': 7, 'hidden_activation': 'relu', 'dropout_rate': 0.0, 'layer_norm_epsilon': 1e-06}, 'registered_name': 'keras_hub>SAM3GeometryEncoder'}
+* **detr_encoder:** {'module': 'keras_hub.src.models.sam3.sam3_detr_encoder', 'class_name': 'SAM3DetrEncoder', 'config': {'name': 'sam3_detr_encoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'num_layers': 6, 'hidden_dim': 256, 'intermediate_dim': 2048, 'num_heads': 8, 'hidden_activation': 'relu', 'dropout_rate': 0.1, 'layer_norm_epsilon': 1e-06}, 'registered_name': 'keras_hub>SAM3DetrEncoder'}
+* **detr_decoder:** {'module': 'keras_hub.src.models.sam3.sam3_detr_decoder', 'class_name': 'SAM3DetrDecoder', 'config': {'name': 'sam3_detr_decoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'image_shape': [1008, 1008, 3], 'patch_size': 14, 'num_layers': 6, 'hidden_dim': 256, 'intermediate_dim': 2048, 'num_heads': 8, 'num_queries': 200, 'hidden_activation': 'relu', 'dropout_rate': 0.1, 'layer_norm_epsilon': 1e-06}, 'registered_name': 'keras_hub>SAM3DetrDecoder'}
+* **mask_decoder:** {'module': 'keras_hub.src.models.sam3.sam3_mask_decoder', 'class_name': 'SAM3MaskDecoder', 'config': {'name': 'sam3_mask_decoder', 'trainable': True, 'dtype': {'module': 'keras', 'class_name': 'DTypePolicy', 'config': {'name': 'float32'}, 'registered_name': None}, 'num_upsampling_stages': 3, 'hidden_dim': 256, 'num_heads': 8, 'dropout_rate': 0.0, 'layer_norm_epsilon': 1e-06}, 'registered_name': 'keras_hub>SAM3MaskDecoder'}
+This model card has been generated automatically and should be completed by the model author. See [Model Cards documentation](https://huggingface.co/docs/hub/model-cards) for more information.

assets/tokenizer/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

assets/tokenizer/vocabulary.json ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

	@@ -0,0 +1,196 @@

+{
+    "module": "keras_hub.src.models.sam3.sam3_pc_backbone",
+    "class_name": "SAM3PromptableConceptBackbone",
+    "config": {
+        "name": "sam3_promptable_concept_backbone",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "vision_encoder": {
+            "module": "keras_hub.src.models.sam3.sam3_vision_encoder",
+            "class_name": "SAM3VisionEncoder",
+            "config": {
+                "name": "sam3_vision_encoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "image_shape": [
+                    1008,
+                    1008,
+                    3
+                ],
+                "patch_size": 14,
+                "num_layers": 32,
+                "hidden_dim": 1024,
+                "intermediate_dim": 4736,
+                "num_heads": 16,
+                "fpn_hidden_dim": 256,
+                "fpn_scale_factors": [
+                    4.0,
+                    2.0,
+                    1.0,
+                    0.5
+                ],
+                "pretrain_image_shape": [
+                    336,
+                    336,
+                    3
+                ],
+                "hidden_activation": "gelu",
+                "rope_theta": 10000.0,
+                "window_size": 24,
+                "global_attn_indexes": [
+                    7,
+                    15,
+                    23,
+                    31
+                ],
+                "attention_dropout_rate": 0.0,
+                "hidden_dropout_rate": 0.0,
+                "layer_norm_epsilon": 1e-06
+            },
+            "registered_name": "keras_hub>SAM3VisionEncoder"
+        },
+        "text_encoder": {
+            "module": "keras_hub.src.models.sam3.sam3_text_encoder",
+            "class_name": "SAM3TextEncoder",
+            "config": {
+                "name": "sam3_text_encoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "vocabulary_size": 49408,
+                "embedding_dim": 1024,
+                "hidden_dim": 1024,
+                "num_layers": 24,
+                "num_heads": 16,
+                "intermediate_dim": 4096,
+                "intermediate_activation": "gelu",
+                "max_sequence_length": 32,
+                "layer_norm_epsilon": 1e-05
+            },
+            "registered_name": "keras_hub>SAM3TextEncoder"
+        },
+        "geometry_encoder": {
+            "module": "keras_hub.src.models.sam3.sam3_geometry_encoder",
+            "class_name": "SAM3GeometryEncoder",
+            "config": {
+                "name": "sam3_geometry_encoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "num_layers": 3,
+                "hidden_dim": 256,
+                "intermediate_dim": 2048,
+                "num_heads": 8,
+                "roi_size": 7,
+                "hidden_activation": "relu",
+                "dropout_rate": 0.0,
+                "layer_norm_epsilon": 1e-06
+            },
+            "registered_name": "keras_hub>SAM3GeometryEncoder"
+        },
+        "detr_encoder": {
+            "module": "keras_hub.src.models.sam3.sam3_detr_encoder",
+            "class_name": "SAM3DetrEncoder",
+            "config": {
+                "name": "sam3_detr_encoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "num_layers": 6,
+                "hidden_dim": 256,
+                "intermediate_dim": 2048,
+                "num_heads": 8,
+                "hidden_activation": "relu",
+                "dropout_rate": 0.1,
+                "layer_norm_epsilon": 1e-06
+            },
+            "registered_name": "keras_hub>SAM3DetrEncoder"
+        },
+        "detr_decoder": {
+            "module": "keras_hub.src.models.sam3.sam3_detr_decoder",
+            "class_name": "SAM3DetrDecoder",
+            "config": {
+                "name": "sam3_detr_decoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "image_shape": [
+                    1008,
+                    1008,
+                    3
+                ],
+                "patch_size": 14,
+                "num_layers": 6,
+                "hidden_dim": 256,
+                "intermediate_dim": 2048,
+                "num_heads": 8,
+                "num_queries": 200,
+                "hidden_activation": "relu",
+                "dropout_rate": 0.1,
+                "layer_norm_epsilon": 1e-06
+            },
+            "registered_name": "keras_hub>SAM3DetrDecoder"
+        },
+        "mask_decoder": {
+            "module": "keras_hub.src.models.sam3.sam3_mask_decoder",
+            "class_name": "SAM3MaskDecoder",
+            "config": {
+                "name": "sam3_mask_decoder",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "num_upsampling_stages": 3,
+                "hidden_dim": 256,
+                "num_heads": 8,
+                "dropout_rate": 0.0,
+                "layer_norm_epsilon": 1e-06
+            },
+            "registered_name": "keras_hub>SAM3MaskDecoder"
+        }
+    },
+    "registered_name": "keras_hub>SAM3PromptableConceptBackbone"
+}

image_converter.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+    "module": "keras_hub.src.models.sam3.sam3_image_converter",
+    "class_name": "SAM3ImageConverter",
+    "config": {
+        "name": "sam3_image_converter",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "image_size": [
+            1008,
+            1008
+        ],
+        "scale": [
+            0.00784313725490196,
+            0.00784313725490196,
+            0.00784313725490196
+        ],
+        "offset": [
+            -1.0,
+            -1.0,
+            -1.0
+        ],
+        "interpolation": "bilinear",
+        "antialias": true,
+        "crop_to_aspect_ratio": false,
+        "pad_to_aspect_ratio": false,
+        "bounding_box_format": "yxyx"
+    },
+    "registered_name": "keras_hub>SAM3ImageConverter"
+}

metadata.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "keras_version": "3.13.2",
+    "keras_hub_version": "0.26.0.dev0",
+    "parameter_count": 849288502,
+    "date_saved": "2026-01-30@22:36:53",
+    "tasks": [
+        "ImageSegmenter"
+    ]
+}

model.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd36085331939d1c89b8714f16882f7dff33bc150d3b8d1f4e890112ccab2073
+size 3400207368

preprocessor.json ADDED Viewed

	@@ -0,0 +1,77 @@

+{
+    "module": "keras_hub.src.models.sam3.sam3_pc_image_segmenter_preprocessor",
+    "class_name": "SAM3PromptableConceptImageSegmenterPreprocessor",
+    "config": {
+        "name": "sam3_promptable_concept_image_segmenter_preprocessor",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "tokenizer": {
+            "module": "keras_hub.src.models.sam3.sam3_tokenizer",
+            "class_name": "SAM3Tokenizer",
+            "config": {
+                "name": "sam3_tokenizer",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "int32"
+                    },
+                    "registered_name": null
+                },
+                "config_file": "tokenizer.json",
+                "sequence_length": null,
+                "add_prefix_space": false
+            },
+            "registered_name": "keras_hub>SAM3Tokenizer"
+        },
+        "image_converter": {
+            "module": "keras_hub.src.models.sam3.sam3_image_converter",
+            "class_name": "SAM3ImageConverter",
+            "config": {
+                "name": "sam3_image_converter",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "image_size": [
+                    1008,
+                    1008
+                ],
+                "scale": [
+                    0.00784313725490196,
+                    0.00784313725490196,
+                    0.00784313725490196
+                ],
+                "offset": [
+                    -1.0,
+                    -1.0,
+                    -1.0
+                ],
+                "interpolation": "bilinear",
+                "antialias": true,
+                "crop_to_aspect_ratio": false,
+                "pad_to_aspect_ratio": false,
+                "bounding_box_format": "yxyx"
+            },
+            "registered_name": "keras_hub>SAM3ImageConverter"
+        },
+        "config_file": "preprocessor.json",
+        "sequence_length": 32,
+        "add_start_token": true,
+        "add_end_token": true
+    },
+    "registered_name": "keras_hub>SAM3PromptableConceptImageSegmenterPreprocessor"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+    "module": "keras_hub.src.models.sam3.sam3_tokenizer",
+    "class_name": "SAM3Tokenizer",
+    "config": {
+        "name": "sam3_tokenizer",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "int32"
+            },
+            "registered_name": null
+        },
+        "config_file": "tokenizer.json",
+        "sequence_length": null,
+        "add_prefix_space": false
+    },
+    "registered_name": "keras_hub>SAM3Tokenizer"
+}