Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

.gitattributes +1 -0
assets/tokenizer/vocabulary.spm +3 -0
config.json +39 -0
metadata.json +9 -0
model.weights.h5 +3 -0
preprocessor.json +45 -0
task.json +92 -0
tokenizer.json +22 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+assets/tokenizer/vocabulary.spm filter=lfs diff=lfs merge=lfs -text

assets/tokenizer/vocabulary.spm ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1299c11d7cf632ef3b4e11937501358ada021bbdf7c47638d13c0ee982f2e79c
+size 4689074

config.json ADDED Viewed

	@@ -0,0 +1,39 @@

+{
+    "module": "keras_hub.src.models.gemma3.gemma3_backbone",
+    "class_name": "Gemma3Backbone",
+    "config": {
+        "name": "gemma3_backbone",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "vocabulary_size": 262144,
+        "image_size": null,
+        "num_layers": 18,
+        "num_query_heads": 4,
+        "num_key_value_heads": 1,
+        "hidden_dim": 640,
+        "intermediate_dim": 2048,
+        "head_dim": 256,
+        "query_head_dim_normalize": true,
+        "use_query_key_norm": true,
+        "use_post_ffw_norm": true,
+        "use_post_attention_norm": true,
+        "attention_logit_soft_cap": null,
+        "final_logit_soft_cap": null,
+        "use_sliding_window_attention": true,
+        "sliding_window_size": 512,
+        "local_rope_scaling_factor": 1.0,
+        "global_rope_scaling_factor": 1.0,
+        "vision_encoder": null,
+        "use_bidirectional_attention": false,
+        "layer_norm_epsilon": 1e-06,
+        "dropout": 0
+    },
+    "registered_name": "keras_hub>Gemma3Backbone"
+}

metadata.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "keras_version": "3.11.3",
+    "keras_hub_version": "0.23.0",
+    "parameter_count": 268632704,
+    "date_saved": "2025-10-22@11:39:55",
+    "tasks": [
+        "CausalLM"
+    ]
+}

model.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c2d393486ec8c75eaa8b15259c6df26e1da8b07d0415b384c92d3e7996e936e
+size 1073167432

preprocessor.json ADDED Viewed

	@@ -0,0 +1,45 @@

+{
+    "module": "keras_hub.src.models.gemma3.gemma3_causal_lm_preprocessor",
+    "class_name": "Gemma3CausalLMPreprocessor",
+    "config": {
+        "name": "gemma3_causal_lm_preprocessor",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "tokenizer": {
+            "module": "keras_hub.src.models.gemma3.gemma3_tokenizer",
+            "class_name": "Gemma3Tokenizer",
+            "config": {
+                "name": "gemma3_tokenizer",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "int32"
+                    },
+                    "registered_name": null
+                },
+                "config_file": "tokenizer.json",
+                "proto": null,
+                "sequence_length": null,
+                "add_bos": false,
+                "add_eos": false
+            },
+            "registered_name": "keras_hub>Gemma3Tokenizer"
+        },
+        "config_file": "preprocessor.json",
+        "sequence_length": 256,
+        "add_start_token": true,
+        "add_end_token": true,
+        "num_vision_tokens_per_image": 0,
+        "max_images_per_prompt": 0
+    },
+    "registered_name": "keras_hub>Gemma3CausalLMPreprocessor"
+}

task.json ADDED Viewed

	@@ -0,0 +1,92 @@

+{
+    "module": "keras_hub.src.models.gemma3.gemma3_causal_lm",
+    "class_name": "Gemma3CausalLM",
+    "config": {
+        "backbone": {
+            "module": "keras_hub.src.models.gemma3.gemma3_backbone",
+            "class_name": "Gemma3Backbone",
+            "config": {
+                "name": "gemma3_backbone",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "vocabulary_size": 262144,
+                "image_size": null,
+                "num_layers": 18,
+                "num_query_heads": 4,
+                "num_key_value_heads": 1,
+                "hidden_dim": 640,
+                "intermediate_dim": 2048,
+                "head_dim": 256,
+                "query_head_dim_normalize": true,
+                "use_query_key_norm": true,
+                "use_post_ffw_norm": true,
+                "use_post_attention_norm": true,
+                "attention_logit_soft_cap": null,
+                "final_logit_soft_cap": null,
+                "use_sliding_window_attention": true,
+                "sliding_window_size": 512,
+                "local_rope_scaling_factor": 1.0,
+                "global_rope_scaling_factor": 1.0,
+                "vision_encoder": null,
+                "use_bidirectional_attention": false,
+                "layer_norm_epsilon": 1e-06,
+                "dropout": 0
+            },
+            "registered_name": "keras_hub>Gemma3Backbone"
+        },
+        "preprocessor": {
+            "module": "keras_hub.src.models.gemma3.gemma3_causal_lm_preprocessor",
+            "class_name": "Gemma3CausalLMPreprocessor",
+            "config": {
+                "name": "gemma3_causal_lm_preprocessor",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "tokenizer": {
+                    "module": "keras_hub.src.models.gemma3.gemma3_tokenizer",
+                    "class_name": "Gemma3Tokenizer",
+                    "config": {
+                        "name": "gemma3_tokenizer",
+                        "trainable": true,
+                        "dtype": {
+                            "module": "keras",
+                            "class_name": "DTypePolicy",
+                            "config": {
+                                "name": "int32"
+                            },
+                            "registered_name": null
+                        },
+                        "config_file": "tokenizer.json",
+                        "proto": null,
+                        "sequence_length": null,
+                        "add_bos": false,
+                        "add_eos": false
+                    },
+                    "registered_name": "keras_hub>Gemma3Tokenizer"
+                },
+                "config_file": "preprocessor.json",
+                "sequence_length": 256,
+                "add_start_token": true,
+                "add_end_token": true,
+                "num_vision_tokens_per_image": 0,
+                "max_images_per_prompt": 0
+            },
+            "registered_name": "keras_hub>Gemma3CausalLMPreprocessor"
+        },
+        "name": "gemma3_causal_lm"
+    },
+    "registered_name": "keras_hub>Gemma3CausalLM"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+    "module": "keras_hub.src.models.gemma3.gemma3_tokenizer",
+    "class_name": "Gemma3Tokenizer",
+    "config": {
+        "name": "gemma3_tokenizer",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "int32"
+            },
+            "registered_name": null
+        },
+        "config_file": "tokenizer.json",
+        "proto": null,
+        "sequence_length": null,
+        "add_bos": false,
+        "add_eos": false
+    },
+    "registered_name": "keras_hub>Gemma3Tokenizer"
+}