Upload BEiT3ForVietnameseVisualQuestionAnswering

Files changed (4) hide show

config.json ADDED Viewed

+{
+  "activation_dropout": 0.0,
+  "activation_fn": "gelu",
+  "architectures": [
+    "BEiT3ForVietnameseVisualQuestionAnswering"
+  ],
+  "attention_dropout": 0.0,
+  "auto_map": {
+    "AutoConfig": "configuration_vivqa.ViVQAConfig",
+    "AutoModel": "modeling_vivqa.BEiT3ForVietnameseVisualQuestionAnswering"
+  },
+  "bert_init": false,
+  "checkpoint_activations": false,
+  "ddp_rank": 0,
+  "deepnorm": false,
+  "drop_path_rate": 0.0,
+  "dropout": 0.0,
+  "encoder_attention_heads": 4,
+  "encoder_embed_dim": 768,
+  "encoder_ffn_embed_dim": 3072,
+  "encoder_layers": 4,
+  "encoder_normalize_before": true,
+  "fsdp": false,
+  "img_size": 224,
+  "in_chans": 3,
+  "layernorm_embedding": false,
+  "layernorm_eps": 1e-05,
+  "max_rel_pos": 0,
+  "max_source_positions": 1024,
+  "model_type": "vivqa",
+  "moe_eval_capacity_token_fraction": 0.25,
+  "moe_expert_count": 0,
+  "moe_freq": 0,
+  "moe_gating_use_fp32": true,
+  "moe_normalize_gate_prob_before_dropping": false,
+  "moe_second_expert_policy": "random",
+  "moe_top1_expert": false,
+  "multiway": true,
+  "no_output_layer": true,
+  "no_scale_embedding": true,
+  "normalize_output": true,
+  "patch_size": 16,
+  "rel_pos_buckets": 0,
+  "share_encoder_input_output_embed": false,
+  "subln": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.36.2",
+  "use_xmoe": false,
+  "vocab_size": -1,
+  "xpos_rel_pos": false,
+  "xpos_scale_base": 512
+}

configuration_vivqa.py CHANGED Viewed

@@ -1,4 +1,5 @@
 from transformers import PretrainedConfig
 class ViVQAConfig(PretrainedConfig):
     model_type = "vivqa"

 from transformers import PretrainedConfig
+from torchscale.architecture.config import EncoderConfig
 class ViVQAConfig(PretrainedConfig):
     model_type = "vivqa"

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:06d19ca8565c6ca7b5717df05fd5490768bf2d73e27f4b662fbd9ae120ca71e1
+size 4911305908

modeling_vivqa.py CHANGED Viewed

@@ -13,6 +13,7 @@ from dataclasses import dataclass
 from typing import Optional
 from efficientnet_pytorch import EfficientNet
 from lavis.common.registry import registry
 class BartPhoExtractor(nn.Module):
     def __init__(self):

 from typing import Optional
 from efficientnet_pytorch import EfficientNet
 from lavis.common.registry import registry
+from .configuration_vivqa import ViVQAConfig
 class BartPhoExtractor(nn.Module):
     def __init__(self):