tencent
/

VersaViT

text-generation-inference

Model card Files Files and versions

VersaViT / config.json

code-kunkun's picture

Upload folder using huggingface_hub

e795dc7 verified 7 days ago

history blame contribute delete

461 Bytes

	{
	"architectures": [
	"Qwen2VisionTransformerPretrainedModel"
	],
	"depth": 32,
	"embed_dim": 1280,
	"hidden_act": "quick_gelu",
	"hidden_size": 3584,
	"in_channels": 3,
	"in_chans": 3,
	"initializer_range": 0.02,
	"mlp_ratio": 4,
	"model_type": "qwen2_vl",
	"num_heads": 16,
	"patch_size": 14,
	"spatial_merge_size": 2,
	"spatial_patch_size": 14,
	"temporal_patch_size": 2,
	"torch_dtype": "bfloat16",
	"transformers_version": "4.52.1"
	}