vngrs-ai
/

VBART-Large-Base

text2text-generation

Model card Files Files and versions

meliksahturker commited on 26 days ago

Commit

758ea6a

·

verified ·

1 Parent(s): ca40dc9

Update README.md

Files changed (1) hide show

README.md +3 -0

README.md CHANGED Viewed

@@ -18,6 +18,9 @@ It comes in two sizes:
 - **VBART-Large**: 387M parameters
 - **VBART-XLarge**: 740M parameters
 - **Developed by:** [VNGRS-AI](https://vngrs.com/ai/)
 - **Model type:**  Transformer encoder-decoder based on mBART architecture

 - **VBART-Large**: 387M parameters
 - **VBART-XLarge**: 740M parameters
+VBART-XLarge is created by adding extra Transformer layers between the layers of VBART-Large. Hence it was able to transfer learned weights from the smaller model while doublings its number of layers.
+VBART-XLarge improves the results compared to VBART-Large albeit in small margins.
 - **Developed by:** [VNGRS-AI](https://vngrs.com/ai/)
 - **Model type:**  Transformer encoder-decoder based on mBART architecture