Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

README.md +44 -0
config.json +156 -0
image_converter.json +28 -0
metadata.json +9 -0
model.weights.h5 +3 -0
preprocessor.json +46 -0
task.json +246 -0

README.md ADDED Viewed

	@@ -0,0 +1,44 @@

+---
+library_name: keras-hub
+---
+This is a [`DFine` model](https://keras.io/api/keras_hub/models/d_fine) uploaded using the KerasHub library and can be used with JAX, TensorFlow, and PyTorch backends.
+This model is related to a `ObjectDetector` task.
+Model config:
+* **name:** d_fine_backbone
+* **trainable:** True
+* **backbone:** {'module': 'keras_hub.src.models.hgnetv2.hgnetv2_backbone', 'class_name': 'HGNetV2Backbone', 'config': {'name': 'hg_net_v2_backbone', 'trainable': True, 'depths': [3, 4, 6, 3], 'embedding_size': 32, 'hidden_sizes': [128, 256, 512, 1024], 'stem_channels': [3, 16, 16], 'hidden_act': 'relu', 'use_learnable_affine_block': True, 'stackwise_stage_filters': [[16, 16, 64, 1, 3, 3], [64, 32, 256, 1, 3, 3], [256, 64, 512, 2, 3, 5], [512, 128, 1024, 1, 3, 5]], 'apply_downsample': [False, True, True, True], 'use_lightweight_conv_block': [False, False, True, True], 'image_shape': [None, None, 3], 'out_features': ['stage2', 'stage3', 'stage4'], 'data_format': 'channels_last'}, 'registered_name': 'keras_hub>HGNetV2Backbone'}
+* **decoder_in_channels:** [256, 256, 256]
+* **encoder_hidden_dim:** 256
+* **num_labels:** 80
+* **num_denoising:** 100
+* **learn_initial_query:** False
+* **num_queries:** 300
+* **anchor_image_size:** [640, 640]
+* **feat_strides:** [8, 16, 32]
+* **num_feature_levels:** 3
+* **hidden_dim:** 256
+* **encoder_in_channels:** [256, 512, 1024]
+* **encode_proj_layers:** [2]
+* **num_attention_heads:** 8
+* **encoder_ffn_dim:** 1024
+* **num_encoder_layers:** 1
+* **hidden_expansion:** 0.5
+* **depth_multiplier:** 0.34
+* **eval_idx:** -1
+* **box_noise_scale:** 1.0
+* **label_noise_ratio:** 0.5
+* **labels:** None
+* **num_decoder_layers:** 3
+* **decoder_attention_heads:** 8
+* **decoder_ffn_dim:** 1024
+* **decoder_method:** default
+* **decoder_n_points:** [3, 6, 3]
+* **lqe_hidden_dim:** 64
+* **num_lqe_layers:** 2
+* **seed:** 0
+* **image_shape:** [None, None, 3]
+* **data_format:** channels_last
+* **out_features:** ['stage2', 'stage3', 'stage4']
+This model card has been generated automatically and should be completed by the model author. See [Model Cards documentation](https://huggingface.co/docs/hub/model-cards) for more information.

config.json ADDED Viewed

	@@ -0,0 +1,156 @@

+{
+    "module": "keras_hub.src.models.d_fine.d_fine_backbone",
+    "class_name": "DFineBackbone",
+    "config": {
+        "name": "d_fine_backbone",
+        "trainable": true,
+        "backbone": {
+            "module": "keras_hub.src.models.hgnetv2.hgnetv2_backbone",
+            "class_name": "HGNetV2Backbone",
+            "config": {
+                "name": "hg_net_v2_backbone",
+                "trainable": true,
+                "depths": [
+                    3,
+                    4,
+                    6,
+                    3
+                ],
+                "embedding_size": 32,
+                "hidden_sizes": [
+                    128,
+                    256,
+                    512,
+                    1024
+                ],
+                "stem_channels": [
+                    3,
+                    16,
+                    16
+                ],
+                "hidden_act": "relu",
+                "use_learnable_affine_block": true,
+                "stackwise_stage_filters": [
+                    [
+                        16,
+                        16,
+                        64,
+                        1,
+                        3,
+                        3
+                    ],
+                    [
+                        64,
+                        32,
+                        256,
+                        1,
+                        3,
+                        3
+                    ],
+                    [
+                        256,
+                        64,
+                        512,
+                        2,
+                        3,
+                        5
+                    ],
+                    [
+                        512,
+                        128,
+                        1024,
+                        1,
+                        3,
+                        5
+                    ]
+                ],
+                "apply_downsample": [
+                    false,
+                    true,
+                    true,
+                    true
+                ],
+                "use_lightweight_conv_block": [
+                    false,
+                    false,
+                    true,
+                    true
+                ],
+                "image_shape": [
+                    null,
+                    null,
+                    3
+                ],
+                "out_features": [
+                    "stage2",
+                    "stage3",
+                    "stage4"
+                ],
+                "data_format": "channels_last"
+            },
+            "registered_name": "keras_hub>HGNetV2Backbone"
+        },
+        "decoder_in_channels": [
+            256,
+            256,
+            256
+        ],
+        "encoder_hidden_dim": 256,
+        "num_labels": 80,
+        "num_denoising": 100,
+        "learn_initial_query": false,
+        "num_queries": 300,
+        "anchor_image_size": [
+            640,
+            640
+        ],
+        "feat_strides": [
+            8,
+            16,
+            32
+        ],
+        "num_feature_levels": 3,
+        "hidden_dim": 256,
+        "encoder_in_channels": [
+            256,
+            512,
+            1024
+        ],
+        "encode_proj_layers": [
+            2
+        ],
+        "num_attention_heads": 8,
+        "encoder_ffn_dim": 1024,
+        "num_encoder_layers": 1,
+        "hidden_expansion": 0.5,
+        "depth_multiplier": 0.34,
+        "eval_idx": -1,
+        "box_noise_scale": 1.0,
+        "label_noise_ratio": 0.5,
+        "labels": null,
+        "num_decoder_layers": 3,
+        "decoder_attention_heads": 8,
+        "decoder_ffn_dim": 1024,
+        "decoder_method": "default",
+        "decoder_n_points": [
+            3,
+            6,
+            3
+        ],
+        "lqe_hidden_dim": 64,
+        "num_lqe_layers": 2,
+        "seed": 0,
+        "image_shape": [
+            null,
+            null,
+            3
+        ],
+        "data_format": "channels_last",
+        "out_features": [
+            "stage2",
+            "stage3",
+            "stage4"
+        ]
+    },
+    "registered_name": "keras_hub>DFineBackbone"
+}

image_converter.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+    "module": "keras_hub.src.models.d_fine.d_fine_image_converter",
+    "class_name": "DFineImageConverter",
+    "config": {
+        "name": "d_fine_image_converter",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "image_size": [
+            640,
+            640
+        ],
+        "scale": 0.00392156862745098,
+        "offset": null,
+        "interpolation": "bilinear",
+        "antialias": false,
+        "crop_to_aspect_ratio": true,
+        "pad_to_aspect_ratio": false,
+        "bounding_box_format": "yxyx"
+    },
+    "registered_name": "keras_hub>DFineImageConverter"
+}

metadata.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "keras_version": "3.10.0",
+    "keras_hub_version": "0.23.0.dev0",
+    "parameter_count": 10329321,
+    "date_saved": "2025-08-26@07:48:10",
+    "tasks": [
+        "ObjectDetector"
+    ]
+}

model.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d1d31dcc49223401a912375cdcbbcee4b19ff594358a518c979d6abd886954d
+size 43140280

preprocessor.json ADDED Viewed

	@@ -0,0 +1,46 @@

+{
+    "module": "keras_hub.src.models.d_fine.d_fine_object_detector_preprocessor",
+    "class_name": "DFineObjectDetectorPreprocessor",
+    "config": {
+        "name": "d_fine_object_detector_preprocessor",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "image_converter": {
+            "module": "keras_hub.src.models.d_fine.d_fine_image_converter",
+            "class_name": "DFineImageConverter",
+            "config": {
+                "name": "d_fine_image_converter",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "image_size": [
+                    640,
+                    640
+                ],
+                "scale": 0.00392156862745098,
+                "offset": null,
+                "interpolation": "bilinear",
+                "antialias": false,
+                "crop_to_aspect_ratio": true,
+                "pad_to_aspect_ratio": false,
+                "bounding_box_format": "yxyx"
+            },
+            "registered_name": "keras_hub>DFineImageConverter"
+        },
+        "config_file": "preprocessor.json"
+    },
+    "registered_name": "keras_hub>DFineObjectDetectorPreprocessor"
+}

task.json ADDED Viewed

	@@ -0,0 +1,246 @@

+{
+    "module": "keras_hub.src.models.d_fine.d_fine_object_detector",
+    "class_name": "DFineObjectDetector",
+    "config": {
+        "backbone": {
+            "module": "keras_hub.src.models.d_fine.d_fine_backbone",
+            "class_name": "DFineBackbone",
+            "config": {
+                "name": "d_fine_backbone",
+                "trainable": true,
+                "backbone": {
+                    "module": "keras_hub.src.models.hgnetv2.hgnetv2_backbone",
+                    "class_name": "HGNetV2Backbone",
+                    "config": {
+                        "name": "hg_net_v2_backbone",
+                        "trainable": true,
+                        "depths": [
+                            3,
+                            4,
+                            6,
+                            3
+                        ],
+                        "embedding_size": 32,
+                        "hidden_sizes": [
+                            128,
+                            256,
+                            512,
+                            1024
+                        ],
+                        "stem_channels": [
+                            3,
+                            16,
+                            16
+                        ],
+                        "hidden_act": "relu",
+                        "use_learnable_affine_block": true,
+                        "stackwise_stage_filters": [
+                            [
+                                16,
+                                16,
+                                64,
+                                1,
+                                3,
+                                3
+                            ],
+                            [
+                                64,
+                                32,
+                                256,
+                                1,
+                                3,
+                                3
+                            ],
+                            [
+                                256,
+                                64,
+                                512,
+                                2,
+                                3,
+                                5
+                            ],
+                            [
+                                512,
+                                128,
+                                1024,
+                                1,
+                                3,
+                                5
+                            ]
+                        ],
+                        "apply_downsample": [
+                            false,
+                            true,
+                            true,
+                            true
+                        ],
+                        "use_lightweight_conv_block": [
+                            false,
+                            false,
+                            true,
+                            true
+                        ],
+                        "image_shape": [
+                            null,
+                            null,
+                            3
+                        ],
+                        "out_features": [
+                            "stage2",
+                            "stage3",
+                            "stage4"
+                        ],
+                        "data_format": "channels_last"
+                    },
+                    "registered_name": "keras_hub>HGNetV2Backbone"
+                },
+                "decoder_in_channels": [
+                    256,
+                    256,
+                    256
+                ],
+                "encoder_hidden_dim": 256,
+                "num_labels": 80,
+                "num_denoising": 100,
+                "learn_initial_query": false,
+                "num_queries": 300,
+                "anchor_image_size": [
+                    640,
+                    640
+                ],
+                "feat_strides": [
+                    8,
+                    16,
+                    32
+                ],
+                "num_feature_levels": 3,
+                "hidden_dim": 256,
+                "encoder_in_channels": [
+                    256,
+                    512,
+                    1024
+                ],
+                "encode_proj_layers": [
+                    2
+                ],
+                "num_attention_heads": 8,
+                "encoder_ffn_dim": 1024,
+                "num_encoder_layers": 1,
+                "hidden_expansion": 0.5,
+                "depth_multiplier": 0.34,
+                "eval_idx": -1,
+                "box_noise_scale": 1.0,
+                "label_noise_ratio": 0.5,
+                "labels": null,
+                "num_decoder_layers": 3,
+                "decoder_attention_heads": 8,
+                "decoder_ffn_dim": 1024,
+                "decoder_method": "default",
+                "decoder_n_points": [
+                    3,
+                    6,
+                    3
+                ],
+                "lqe_hidden_dim": 64,
+                "num_lqe_layers": 2,
+                "seed": 0,
+                "image_shape": [
+                    null,
+                    null,
+                    3
+                ],
+                "data_format": "channels_last",
+                "out_features": [
+                    "stage2",
+                    "stage3",
+                    "stage4"
+                ]
+            },
+            "registered_name": "keras_hub>DFineBackbone"
+        },
+        "preprocessor": {
+            "module": "keras_hub.src.models.d_fine.d_fine_object_detector_preprocessor",
+            "class_name": "DFineObjectDetectorPreprocessor",
+            "config": {
+                "name": "d_fine_object_detector_preprocessor",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "image_converter": {
+                    "module": "keras_hub.src.models.d_fine.d_fine_image_converter",
+                    "class_name": "DFineImageConverter",
+                    "config": {
+                        "name": "d_fine_image_converter",
+                        "trainable": true,
+                        "dtype": {
+                            "module": "keras",
+                            "class_name": "DTypePolicy",
+                            "config": {
+                                "name": "float32"
+                            },
+                            "registered_name": null
+                        },
+                        "image_size": [
+                            640,
+                            640
+                        ],
+                        "scale": 0.00392156862745098,
+                        "offset": null,
+                        "interpolation": "bilinear",
+                        "antialias": false,
+                        "crop_to_aspect_ratio": true,
+                        "pad_to_aspect_ratio": false,
+                        "bounding_box_format": "yxyx"
+                    },
+                    "registered_name": "keras_hub>DFineImageConverter"
+                },
+                "config_file": "preprocessor.json"
+            },
+            "registered_name": "keras_hub>DFineObjectDetectorPreprocessor"
+        },
+        "name": "d_fine_object_detector",
+        "num_classes": 80,
+        "bounding_box_format": "yxyx",
+        "matcher_class_cost": 2.0,
+        "matcher_bbox_cost": 5.0,
+        "matcher_ciou_cost": 2.0,
+        "use_focal_loss": true,
+        "matcher_alpha": 0.25,
+        "matcher_gamma": 2.0,
+        "weight_loss_vfl": 1.0,
+        "weight_loss_bbox": 5.0,
+        "weight_loss_ciou": 2.0,
+        "weight_loss_fgl": 0.15,
+        "weight_loss_ddf": 1.5,
+        "ddf_temperature": 5.0,
+        "prediction_decoder": {
+            "module": "keras_hub.src.layers.modeling.non_max_supression",
+            "class_name": "NonMaxSuppression",
+            "config": {
+                "name": "non_max_suppression",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "bounding_box_format": "yxyx",
+                "from_logits": true,
+                "iou_threshold": 0.5,
+                "confidence_threshold": 0.5,
+                "max_detections": 300
+            },
+            "registered_name": "keras_hub>NonMaxSuppression"
+        }
+    },
+    "registered_name": "keras_hub>DFineObjectDetector"
+}