hf-internal-testing
/

tiny-AudioLDM2Pipeline

AudioLDM2Pipeline

Model card Files Files and versions

tiny-AudioLDM2Pipeline / text_encoder /config.json

sayakpaul's picture

sayakpaul HF Staff

Upload AudioLDM2Pipeline

c92b425 verified 3 days ago

history blame contribute delete

1.73 kB

	{
	"architectures": [
	"ClapModel"
	],
	"audio_config": {
	"aff_block_r": 4,
	"attention_probs_dropout_prob": 0.0,
	"depths": [
	1,
	1
	],
	"drop_path_rate": 0.0,
	"enable_fusion": false,
	"enable_patch_layer_norm": true,
	"flatten_patch_embeds": true,
	"fusion_type": null,
	"hidden_act": "gelu",
	"hidden_dropout_prob": 0.1,
	"hidden_size": 192,
	"initializer_factor": 1.0,
	"intermediate_size": 37,
	"layer_norm_eps": 1e-05,
	"mlp_ratio": 4.0,
	"model_type": "clap_audio_model",
	"num_attention_heads": [
	1,
	1
	],
	"num_classes": 527,
	"num_hidden_layers": 1,
	"num_mel_bins": 8,
	"patch_embed_input_channels": 4,
	"patch_embeds_hidden_size": 96,
	"patch_size": 2,
	"patch_stride": 2,
	"projection_dim": 16,
	"projection_hidden_act": "relu",
	"qkv_bias": true,
	"spec_size": 8,
	"window_size": 4
	},
	"dtype": "float32",
	"hidden_size": 8,
	"initializer_factor": 1.0,
	"logit_scale_init_value": 14.285714285714285,
	"model_type": "clap",
	"num_hidden_layers": 3,
	"projection_dim": 16,
	"projection_hidden_act": "relu",
	"text_config": {
	"attention_probs_dropout_prob": 0.1,
	"hidden_act": "gelu",
	"hidden_dropout_prob": 0.1,
	"hidden_size": 8,
	"initializer_factor": 1.0,
	"intermediate_size": 37,
	"layer_norm_eps": 1e-05,
	"max_position_embeddings": 514,
	"model_type": "clap_text_model",
	"num_attention_heads": 1,
	"num_hidden_layers": 1,
	"position_embedding_type": "absolute",
	"projection_dim": 16,
	"projection_hidden_act": "relu",
	"type_vocab_size": 1,
	"use_cache": true,
	"vocab_size": 1000
	},
	"transformers_version": "4.57.1"
	}