Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /it /chapter1 /7.md

rtrm

about 1 month ago

preview code

download

raw

1.6 kB

	# Modelli sequence-to-sequence

	<CourseFloatingBanner
	chapter={1}
	classNames="absolute z-10 right-0 top-0"
	/>

	<Youtube id="0_4KEb08xrE" />

	I modelli encoder-decoder (detti anche modelli sequence-to-sequence) utilizzano entrambi i componenti dell'architettura Transformer. Ad ogni passaggio, gli attention layer dell'encoder hanno accesso a tutte le parole della frase iniziale, mentre gli attention layer del decoder possono solo accedere alle parole che precedono linearmente una data parola nell'input.

	Il pre-addestramento di questi modelli può essere fatto utilizzando gli obiettivi dei modelli encoder o decoder, anche se solitamente include un livello di complessità maggiore. Ad esempio, [T5](https://huggingface.co/t5-base) è pre-addestrato rimpiazzando porzioni random di testo (che possono contenere più di una parola) con una speciale mask word, con l'obiettivo di predirre il testo rimpiazzato dalla mask word stessa.

	I modelli sequence-to-sequence sono più adatti ai compiti che hanno a che fare con la generazione di nuove frasi sulla base di un input preciso, come il riassunto, la traduzione, o la generazione di risposte a domande.

	Tra i rappresentanti di questa famiglia di modelli ci sono:

	- [BART](https://huggingface.co/transformers/model_doc/bart.html)
	- [mBART](https://huggingface.co/transformers/model_doc/mbart.html)
	- [Marian](https://huggingface.co/transformers/model_doc/marian.html)
	- [T5](https://huggingface.co/transformers/model_doc/t5.html)


	<EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/it/chapter1/7.mdx" />

Xet Storage Details

Size:: 1.6 kB
Xet hash:: ce9da397c3f3e5a6a9a586a8d9aac752f8790682b036c5d8995fec1b7fb5ae65

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.