Buckets:
| # Модели-кодировщики | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="MUqNwgPjJvQ" /> | |
| Кодировщики используют только компонент кодировщика трансформера. На каждом этапе слой внимания может использовать все слова исходного предложения. Эти модели часто характеризуют как имеющие двунаправленное внимание (англ. bi-directional attention), и часто называют моделями *автокодировщиками*. | |
| Предварительное обучение этих моделей обычно заключается в том, чтобы как-то исказить предложение (например, путем маскировки в нем случайных слов) и поставить перед моделью задачу найти или восстановить исходное предложение. | |
| Кодировщики лучше всего подходят для задач, требующих _понимания_ всего предложения, таких как классификация предложений, распознавание именованных сущностей (и, в более общем смысле, классификация слов) и ответы на вопросы с извлечением информации из контекста (выделительные вопросно-ответные системы). | |
| К представителям этого семейства моделей относятся: | |
| - [ALBERT](https://huggingface.co/transformers/model_doc/albert.html) | |
| - [BERT](https://huggingface.co/transformers/model_doc/bert.html) | |
| - [DistilBERT](https://huggingface.co/transformers/model_doc/distilbert.html) | |
| - [ELECTRA](https://huggingface.co/transformers/model_doc/electra.html) | |
| - [RoBERTa](https://huggingface.co/transformers/model_doc/roberta.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ru/chapter1/5.mdx" /> |
Xet Storage Details
- Size:
- 2.23 kB
- Xet hash:
- 450f58d441cde4152e2e3181a72385683274a04eb7c279920ce2300617a9b2e8
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.