gurumurthy3
/

gpt2-stackformer-vision_V2

vision-language

image-captioning

cross-attention

perceiver-resampler

Model card Files Files and versions

gpt2-stackformer-vision_V2 / tokenizer

3.36 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

gurumurthy3's picture

Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens)

4666d47 verified about 11 hours ago

added_tokens.json

23 Bytes
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago
merges.txt

456 kB
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago
special_tokens_map.json

239 Bytes
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago
tokenizer.json

2.11 MB
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago
tokenizer_config.json

643 Bytes
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago
vocab.json

798 kB
Upload V2: stackformer GPT-2 + sparse cross-attention vision model (128 visual tokens) about 11 hours ago