Buckets:
| # Модели-декодировщики | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="d_ixlCubqQw" /> | |
| Декодировщики используют только компонент декодирования трансформера. На каждом этапе для текущего слова слой внимания может получить доступ только к словам, которые были расположены до него в предложении. Такие модели часто называются *авторегрессионными моделями*. | |
| Процесс предобучения декодировщиков обычно заключается в предсказании следующего слова в предложении. | |
| Такие модели лучше всего подходят для задач, связанных с генерацией текста. | |
| Представителями этого семейства моделей являются: | |
| - [CTRL](https://huggingface.co/transformers/model_doc/ctrl.html) | |
| - [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt) | |
| - [GPT-2](https://huggingface.co/transformers/model_doc/gpt2.html) | |
| - [Transformer XL](https://huggingface.co/transformers/model_doc/transformerxl.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ru/chapter1/6.mdx" /> |
Xet Storage Details
- Size:
- 1.48 kB
- Xet hash:
- 161074a2f6272040f3cc29162db9ff8a5ba31f52f3fcb730f30a03665721c5f5
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.