Buckets:
| # Modele Sequence-to-sequence[modele-sequence-to-sequence] | |
| <CourseFloatingBanner | |
| chapter={1} | |
| classNames="absolute z-10 right-0 top-0" | |
| /> | |
| <Youtube id="0_4KEb08xrE" /> | |
| Modelele Encoder-Decoder (denumite și *modele sequence-to-sequence*) utilizează ambele părți ale arhitecturii Transformer. În fiecare etapă, layerele de atenție ale encoder-ului pot accesa toate cuvintele din propoziția inițială, în timp ce layerele de atenție ale decoder-ului pot accesa doar cuvintele poziționate înaintea unui anumit cuvânt din intrare. | |
| Preantrenarea acestor modele se poate face folosind obiectivele modelelor de codificare sau de decodificare, dar de obicei implică ceva un pic mai complex. De exemplu, [T5](https://huggingface.co/t5-base) este prenatrenat prin înlocuirea unor intervale aleatorii de text (care pot conține mai multe cuvinte) cu un singur cuvânt special mascat, iar obiectivul este apoi de a prezice textul pe care îl înlocuiește acest cuvânt mascat. | |
| Modelele Sequence-to-sequence sunt cele mai potrivite pentru sarcinile care se învârt în jurul generării de noi propoziții în funcție de o intrare dată, cum ar fi rezumarea, traducerea sau răspunsul generativ la întrebări. | |
| Printre reprezentanții acestei familii de modele se numără: | |
| - [BART](https://huggingface.co/transformers/model_doc/bart) | |
| - [mBART](https://huggingface.co/transformers/model_doc/mbart) | |
| - [Marian](https://huggingface.co/transformers/model_doc/marian) | |
| - [T5](https://huggingface.co/transformers/model_doc/t5) | |
| <EditOnGithub source="https://github.com/huggingface/course/blob/main/chapters/ro/chapter1/7.mdx" /> |
Xet Storage Details
- Size:
- 1.64 kB
- Xet hash:
- 6cce36cff1b1c53879ba8dfb44dd5fe2f389c4f4e4d849da6dcd862944fa43fc
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.