Buckets:

hf-doc-build
/

doc-dev

about 1 month ago

1.04 kB

	# Modelli decoder

	<CourseFloatingBanner
	chapter={1}
	classNames="absolute z-10 right-0 top-0"
	/>

	<Youtube id="d_ixlCubqQw" />

	I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti auto-regressive models.

	Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale.

	Questi modelli sono particolarmente adatti a compiti di generazione testuale.

	Alcuni rappresentanti di questa famiglia includono:

	- [CTRL](https://huggingface.co/transformers/model_doc/ctrl.html)
	- [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt)
	- [GPT-2](https://huggingface.co/transformers/model_doc/gpt2.html)
	- [Transformer XL](https://huggingface.co/transformers/model_doc/transfo-xl.html)


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/it/chapter1/6.mdx" />

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.