Buckets:
| # Modelli decoder | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="d_ixlCubqQw" /> | |
| I modelli decoder utilizzano solo il decoder di un modello Transformer. Ad ogni passaggio e per una data parola, gli attention layer hanno accesso solo alle parole che la precedono nella frase. Questi modelli sono spesso detti *auto-regressive models*. | |
| Il pre-addestramento dei modelli decoder ha spesso a che fare con la previsione della parola successiva in un contesto frasale. | |
| Questi modelli sono particolarmente adatti a compiti di generazione testuale. | |
| Alcuni rappresentanti di questa famiglia includono: | |
| - [CTRL](https://huggingface.co/transformers/model_doc/ctrl.html) | |
| - [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt) | |
| - [GPT-2](https://huggingface.co/transformers/model_doc/gpt2.html) | |
| - [Transformer XL](https://huggingface.co/transformers/model_doc/transfo-xl.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/it/chapter1/6.mdx" /> |
Xet Storage Details
- Size:
- 1.04 kB
- Xet hash:
- 5d8bb390663dc4730e25e048278fb3abf70653e84b68f58485ab5bd105789f3c
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.