Buckets:

hf-doc-build
/

doc-dev

about 1 month ago

1.06 kB

	# Decoder-Modelle

	<CourseFloatingBanner
	chapter={1}
	classNames="absolute z-10 right-0 top-0"
	/>

	<Youtube id="d_ixlCubqQw" />

	Decoder-Modelle verwenden nur den Decoder eines Transformer-Modells. Die Attention-Layer können bei jedem Schritt hinsichtlich eines bestimmten Wortes nur auf die Wörter zugreifen, die vor diesem Wort im Satz stehen. Diese Modelle werden oft als autoregressive Modelle bezeichnet.

	Beim Pretraining von Decoder-Modellen geht es in der Regel um die Vorhersage des nächsten Wortes im Satz.

	Diese Modelle sind am besten für Aufgaben geeignet, bei denen es um die Generierung von Texten geht.

	Zu dieser Modellfamilie gehören unter anderem:

	- [CTRL](https://huggingface.co/transformers/model_doc/ctrl)
	- [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt)
	- [GPT-2](https://huggingface.co/transformers/model_doc/gpt2)
	- [Transformer XL](https://huggingface.co/transformers/model_doc/transformerxl)


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/de/chapter1/6.mdx" />

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.