ariG23498
/

mod-g4-e2b

Image-Text-to-Text

Model card Files Files and versions

ariG23498 HF Staff commited on 25 days ago

Commit

a9ea01e

·

verified ·

1 Parent(s): 40667dd

Upload Gemma4ForConditionalGeneration

Files changed (2) hide show

config.json +7 -7
model.safetensors +2 -2

config.json CHANGED Viewed

@@ -15,7 +15,7 @@
     "dtype": "bfloat16",
     "gradient_clipping": 10000000000.0,
     "hidden_act": "silu",
-    "hidden_size": 1024,
     "id2label": {
       "0": "LABEL_0",
       "1": "LABEL_1"
@@ -27,7 +27,7 @@
       "LABEL_1": 1
     },
     "model_type": "gemma4_audio",
-    "num_attention_heads": 8,
     "num_hidden_layers": 1,
     "output_attentions": false,
     "output_hidden_states": false,
@@ -65,7 +65,7 @@
     "global_head_dim": 512,
     "head_dim": 256,
     "hidden_activation": "gelu_pytorch_tanh",
-    "hidden_size": 1536,
     "hidden_size_per_layer_input": 256,
     "initializer_range": 0.02,
     "intermediate_size": 6144,
@@ -109,10 +109,10 @@
     "max_position_embeddings": 131072,
     "model_type": "gemma4_text",
     "moe_intermediate_size": null,
-    "num_attention_heads": 8,
     "num_experts": null,
     "num_global_key_value_heads": null,
-    "num_hidden_layers": 1,
     "num_key_value_heads": 1,
     "num_kv_shared_layers": 20,
     "pad_token_id": 0,
@@ -151,7 +151,7 @@
     "global_head_dim": 64,
     "head_dim": 64,
     "hidden_activation": "gelu_pytorch_tanh",
-    "hidden_size": 768,
     "id2label": {
       "0": "LABEL_0",
       "1": "LABEL_1"
@@ -165,7 +165,7 @@
     },
     "max_position_embeddings": 131072,
     "model_type": "gemma4_vision",
-    "num_attention_heads": 12,
     "num_hidden_layers": 1,
     "num_key_value_heads": 12,
     "output_attentions": false,

     "dtype": "bfloat16",
     "gradient_clipping": 10000000000.0,
     "hidden_act": "silu",
+    "hidden_size": 8,
     "id2label": {
       "0": "LABEL_0",
       "1": "LABEL_1"
       "LABEL_1": 1
     },
     "model_type": "gemma4_audio",
+    "num_attention_heads": 1,
     "num_hidden_layers": 1,
     "output_attentions": false,
     "output_hidden_states": false,
     "global_head_dim": 512,
     "head_dim": 256,
     "hidden_activation": "gelu_pytorch_tanh",
+    "hidden_size": 8,
     "hidden_size_per_layer_input": 256,
     "initializer_range": 0.02,
     "intermediate_size": 6144,
     "max_position_embeddings": 131072,
     "model_type": "gemma4_text",
     "moe_intermediate_size": null,
+    "num_attention_heads": 1,
     "num_experts": null,
     "num_global_key_value_heads": null,
+    "num_hidden_layers": 35,
     "num_key_value_heads": 1,
     "num_kv_shared_layers": 20,
     "pad_token_id": 0,
     "global_head_dim": 64,
     "head_dim": 64,
     "hidden_activation": "gelu_pytorch_tanh",
+    "hidden_size": 8,
     "id2label": {
       "0": "LABEL_0",
       "1": "LABEL_1"
     },
     "max_position_embeddings": 131072,
     "model_type": "gemma4_vision",
+    "num_attention_heads": 1,
     "num_hidden_layers": 1,
     "num_key_value_heads": 12,
     "output_attentions": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:af3c84640ecf79b16b380640c814508a88793bf5d54efb97823e82f2708f56ea
-size 1126978354

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca8f8870c7dc56af8f1d333201bfa9585a107eab0f1b662edac405ea5a267507
+size 4719736990