Buckets:

hf-doc-build
/

doc-dev

Files

xet

hf-doc-build/doc-dev / course /pr_1114 /it /chapter1 /6.md

rtrm

about 1 month ago

preview code

download

raw

1.04 kB

Modelli decoder

I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti auto-regressive models.

Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale.

Questi modelli sono particolarmente adatti a compiti di generazione testuale.

Alcuni rappresentanti di questa famiglia includono:

CTRL
GPT
GPT-2
Transformer XL

Xet Storage Details

Size:: 1.04 kB
Xet hash:: 5d8bb390663dc4730e25e048278fb3abf70653e84b68f58485ab5bd105789f3c

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.