Buckets:

rtrm's picture
|
download
raw
821 Bytes

Modelli decoder

I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti auto-regressive models.

Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale.

Questi modelli sono particolarmente adatti a compiti di generazione testuale.

Alcuni rappresentanti di questa famiglia includono:

Xet Storage Details

Size:
821 Bytes
·
Xet hash:
3b636a7b16a0134d33768395313fcef36c2e6f12c293d407dd75ba2a2fa340b7

Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.