Buckets:
| # Les modèles basés sur le décodeur | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="d_ixlCubqQw" /> | |
| Les modèles basés sur le décodeur utilisent seulement le décodeur d'un *transformer*. À chaque étape, pour un mot donné, les couches d'attention ne peuvent strictement accéder qu'aux mots situés avant dans la phrase. Ces modèles sont souvent appelés *modèles autorégressifs*. | |
| Le pré-entraînement des modèles basés sur le décodeur se concentre généralement sur la prédiction du prochain mot dans la phrase. | |
| Ces modèles sont vraiment adaptés aux tâches qui impliquent la génération de texte. | |
| Les modèles qui représentent le mieux la famille des modèles décodeurs sont : | |
| - [CTRL](https://huggingface.co/transformers/model_doc/ctrl.html) | |
| - [GPT](https://huggingface.co/docs/transformers/model_doc/openai-gpt) | |
| - [GPT-2](https://huggingface.co/transformers/model_doc/gpt2.html) | |
| - [Transformer XL](https://huggingface.co/transformers/model_doc/transformerxl.html) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/fr/chapter1/6.mdx" /> |
Xet Storage Details
- Size:
- 1.15 kB
- Xet hash:
- 48ca05faf90349bf5437bd3155352df310cc58be3bd4c8b456769bf9b57f6ca5
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.