deepmind
/

language-perceiver

Model card Files Files and versions

nielsr HF Staff commited on Sep 16, 2021

Commit

704689c

·

1 Parent(s): d4b74a2

Upload config.json

Files changed (1) hide show

config.json +29 -0

config.json ADDED Viewed

	@@ -0,0 +1,29 @@

+{
+  "architectures": [
+    "PerceiverForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "cross_attention_shape_for_attention": "kv",
+  "cross_attention_widening_factor": 1,
+  "d_latents": 1280,
+  "d_model": 768,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "initializer_range": 0.02,
+  "layer_norm_eps": 1e-12,
+  "model_type": "perceiver",
+  "num_blocks": 1,
+  "num_cross_attention_heads": 8,
+  "num_latents": 256,
+  "num_self_attends_per_block": 26,
+  "num_self_attention_heads": 8,
+  "position_embedding_init_scale": 0.02,
+  "qk_channels": 256,
+  "self_attention_widening_factor": 1,
+  "seq_len": 2048,
+  "torch_dtype": "float32",
+  "transformers_version": "4.11.0.dev0",
+  "use_query_residual": true,
+  "v_channels": 1280,
+  "vocab_size": 262
+}