Buckets:
Модели-декодировщики
Декодировщики используют только компонент декодирования трансформера. На каждом этапе для текущего слова слой внимания может получить доступ только к словам, которые были расположены до него в предложении. Такие модели часто называются авторегрессионными моделями.
Процесс предобучения декодировщиков обычно заключается в предсказании следующего слова в предложении.
Такие модели лучше всего подходят для задач, связанных с генерацией текста.
Представителями этого семейства моделей являются:
Xet Storage Details
- Size:
- 1.48 kB
- Xet hash:
- 161074a2f6272040f3cc29162db9ff8a5ba31f52f3fcb730f30a03665721c5f5
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.