Buckets:

rtrm's picture
|
download
raw
1.48 kB

Модели-декодировщики

Декодировщики используют только компонент декодирования трансформера. На каждом этапе для текущего слова слой внимания может получить доступ только к словам, которые были расположены до него в предложении. Такие модели часто называются авторегрессионными моделями.

Процесс предобучения декодировщиков обычно заключается в предсказании следующего слова в предложении.

Такие модели лучше всего подходят для задач, связанных с генерацией текста.

Представителями этого семейства моделей являются:

Xet Storage Details

Size:
1.48 kB
·
Xet hash:
161074a2f6272040f3cc29162db9ff8a5ba31f52f3fcb730f30a03665721c5f5

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.