Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /ru /chapter1 /7.md

rtrm

about 2 months ago

preview code

download

raw

2.3 kB

	# Модели вида "seq2seq"

	<CourseFloatingBanner
	chapter={1}
	classNames="absolute z-10 right-0 top-0"
	/>

	<Youtube id="0_4KEb08xrE" />

	Модели типа кодировщик-декодировщик (также называемые sequence-to-sequence models) используют обе части трансформера. На каждом этапе слой внимания кодировщика получает доступ ко всем словам в исходной последовательности, тогда как слой внимания декодировщика получает доступ только к тем словам, которые расположены до текущего слова.

	Предобучение таких моделей может быть выполнено на задачах, используемых для предобучения моделей кодировщиков или декодировщиков, но обычно все немного сложнее. Например, модель [T5](https://huggingface.co/t5-base) была предобучена путем замены случайных фрагментов текста (фрагменты могут содержать несколько слов) на специальную маску, цель модели - предсказать текст, который заменила маска.

	Модели seq2seq лучше всего подходят для задач генерации новых предложений, зависящих от входного массива данных, например: автоматическое реферирование текста, перевод или в генеративных вопросно-ответных системах.

	Представителями этого семейства являются:

	- [BART](https://huggingface.co/transformers/model_doc/bart.html)
	- [mBART](https://huggingface.co/transformers/model_doc/mbart.html)
	- [Marian](https://huggingface.co/transformers/model_doc/marian.html)
	- [T5](https://huggingface.co/transformers/model_doc/t5.html)


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ru/chapter1/7.mdx" />

Xet Storage Details

Size:: 2.3 kB
Xet hash:: 9ceccee4f382340b15dd725df5e062c79bcbff085b54b8bf83ebff9d08389729

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.