LeroyDyer
/

SpydazWeb_Speech_Vision_EncoderDecoder_Multimodal_5b_Project

image-text-text

audio-text-text

Model card Files Files and versions

LeroyDyer commited on Apr 17, 2024

Commit

736efc3

·

verified ·

1 Parent(s): 9f160b2

Update README.md

Files changed (1) hide show

README.md +1 -12

README.md CHANGED Viewed

@@ -11,18 +11,7 @@ tags:
 - Multi-Modal
 ---
-# ADD VISION
-```python
-print('Add Vision...')
-# ADD HEAD
-# Combine pre-trained encoder and pre-trained decoder to form a Seq2Seq model
 Vmodel = VisionEncoderDecoderModel.from_encoder_decoder_pretrained(

 - Multi-Modal
 ---
+# Creation Process
 Vmodel = VisionEncoderDecoderModel.from_encoder_decoder_pretrained(