trl-internal-testing
/

tiny-PaliGemmaForConditionalGeneration

Image-Text-to-Text

text-generation-inference

Model card Files Files and versions

qgallouedec HF Staff commited on Aug 13, 2025

Commit

2cb3712

·

verified ·

1 Parent(s): b4eeae1

Upload PaliGemmaForConditionalGeneration

Files changed (2) hide show

config.json +18 -9
model.safetensors +2 -2

config.json CHANGED Viewed

@@ -2,10 +2,14 @@
   "architectures": [
     "PaliGemmaForConditionalGeneration"
   ],
   "hidden_size": 2048,
-  "image_token_index": 256000,
   "model_type": "paligemma",
-  "projection_dim": 8,
   "text_config": {
     "attention_bias": false,
     "attention_dropout": 0.0,
@@ -14,32 +18,37 @@
     "hidden_activation": null,
     "hidden_size": 16,
     "initializer_range": 0.02,
-    "intermediate_size": 32,
     "max_position_embeddings": 8192,
     "model_type": "gemma",
     "num_attention_heads": 4,
     "num_hidden_layers": 2,
-    "num_image_tokens": 196,
     "num_key_value_heads": 2,
     "rms_norm_eps": 1e-06,
     "rope_theta": 10000.0,
     "use_cache": true,
-    "vocab_size": 258522
   },
-  "torch_dtype": "float32",
   "transformers_version": "4.56.0.dev0",
   "vision_config": {
     "attention_dropout": 0.0,
     "hidden_act": "gelu_pytorch_tanh",
     "hidden_size": 16,
     "image_size": 224,
-    "intermediate_size": 32,
     "layer_norm_eps": 1e-06,
     "model_type": "siglip_vision_model",
     "num_attention_heads": 4,
     "num_channels": 3,
     "num_hidden_layers": 2,
-    "patch_size": 16,
-    "projection_dim": 8
   }
 }

   "architectures": [
     "PaliGemmaForConditionalGeneration"
   ],
+  "bos_token_id": 2,
+  "eos_token_id": 1,
   "hidden_size": 2048,
+  "ignore_index": -100,
+  "image_token_index": 257152,
   "model_type": "paligemma",
+  "pad_token_id": 0,
+  "projection_dim": 2048,
   "text_config": {
     "attention_bias": false,
     "attention_dropout": 0.0,
     "hidden_activation": null,
     "hidden_size": 16,
     "initializer_range": 0.02,
+    "intermediate_size": 16384,
     "max_position_embeddings": 8192,
     "model_type": "gemma",
     "num_attention_heads": 4,
     "num_hidden_layers": 2,
+    "num_image_tokens": 256,
     "num_key_value_heads": 2,
     "rms_norm_eps": 1e-06,
     "rope_theta": 10000.0,
+    "torch_dtype": "float32",
     "use_cache": true,
+    "vocab_size": 257216
   },
+  "torch_dtype": "bfloat16",
   "transformers_version": "4.56.0.dev0",
   "vision_config": {
     "attention_dropout": 0.0,
     "hidden_act": "gelu_pytorch_tanh",
     "hidden_size": 16,
     "image_size": 224,
+    "intermediate_size": 4304,
     "layer_norm_eps": 1e-06,
     "model_type": "siglip_vision_model",
     "num_attention_heads": 4,
     "num_channels": 3,
     "num_hidden_layers": 2,
+    "num_image_tokens": 256,
+    "num_key_value_heads": 2,
+    "patch_size": 14,
+    "projection_dim": 2048,
+    "projector_hidden_act": "gelu_fast",
+    "vision_use_head": false
   }
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5601312b285dba1d671591395f2e624a08b1dd014d9686fe0b0e2bf329afa9c9
-size 17048992

 version https://git-lfs.github.com/spec/v1
+oid sha256:62bd764abe98bd832ce30f426108b70e2790384596a9ea8257a192d16b219966
+size 12250448