omar-ah
/

ViL-DLM-0.6B

Image-Text-to-Text

vision-language

masked-diffusion

Model card Files Files and versions

ViL-DLM-0.6B / external

1.84 MB

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

omar-ah's picture

Add Vision Transformer and utility functions for sequence processing

b7857c4 about 1 month ago

vision-lstm
Add Vision Transformer and utility functions for sequence processing about 1 month ago